Die ganze weite Welt im Visier

Drei Milliarden Webpages, 150 Millionen Suchanfragen pro Tag, abgewickelt von einer Server-Farm von 10.000 miteinan-der vernetzen Computern - ein Name: Google. Drei Jahre nach ihrem Start ist die Suchmaschine die meistgenutzte. Eine Erfolgsgeschichte.

Die schnelle und effektive Suche im Netz hat seit geraumer Zeit einen verspielt-seltsamen Namen: Google. Eine skurrile Wortschöpfung, die darauf zurückgeht, daß der US-Mathematiker Edward Kasner in den dreißiger Jahren seinen damals neunjährigen Neffen fragte, wie man die unvorstellbar große Zahl zehn hoch 100 wohl "umgangssprachlich" benennen könne: "Googol", so der kreative Junge. Und hatte damit einen Begriff geschaffen, der im Mikrokosmos der mathematischen Fachwelt seither in Gebrauch ist.

Nun: Als die beiden Stanford-Studenten Sergey Brin und Larry Page in der zweiten Hälfte der Neunziger einen Namen für ihr Projekt einer revolutionär neu konstruierten Internet-Suchmaschine benötigten, wandelten sie "Googol" spielerisch zu "Google" um. Heute, knapp mehr als drei Jahre nachdem Google im September 1999 offiziell seine Arbeit aufgenommen hatte, rangiert der Begriff bereits unter den meistbekannten der global verwendeten Markennamen - zumindest in der digitalen Welt: Auf der seit je extrem spartanisch gestalteten Website von Google werden aktuell bereits pro Tag mehr als 150 Millionen Suchanfragen registriert - und binnen Sekundenbruchteilen erfolgreich abgewickelt.

Die atemberaubende Geschwindigkeit und Präzision, mit der Google selbst die absurdesten Ansinnen beantwortet, beruht nicht auf der schlichten Erscheinungsform der Website, die - zugegeben - einen beachtlichen Teil dazu beiträgt, daß die simple Suchmaske blitzschnell am Bildschirm zur Benutzung hochfährt, sondern auf zwei "unsichtbaren" Faktoren, die ihrerseits fassungsloses Staunen erwecken, wenn man weiß, in wie kurzer Zeit sich Google zur heutigen Dimension entwickelt hat.

Zum einen kann die hochintelligent programmierte Such-Software auf den inzwischen größten Index von Internet-Seiten zurückgreifen, der je existiert hat: Mehr als drei Milliarden Webpages hat Google zur Zeit erfaßt, und mit jedem Tag werden es mehr. Zum anderen wird die Rasanz der Abfrage erst dadurch möglich, daß im Hintergrund eine Server-Farm von mehr als 10.000 miteinander vernetzten Computern quasi als mächtiges Kraftwerk des Wissens agiert. Wobei es zudem verblüfft, wie unaufwendig und kostengünstig die Architektur dieses potenten Computer-Verbundes ist: Die Mehrzahl der Einzelserver besteht aus schlichten PCs, die unter dem Betriebssystem Linux als ein gigantischer Cluster zusammenwirken.

Und nicht nur aktuelle Webseiten sind in diesem kollektiven Gedächtnis des Internet systematisch erfaßt, sondern auch mehr als 700 Millionen Messages des sogenannten Usenet, wodurch auch die vielfältig vernetzte Kommunikation der letzten 20 Jahre abrufbar wird. Damit kann Google bei Usenet-Anfragen in Sekundenbruchteilen auf ein Speichervolumen von einem Terabyte an Daten zugreifen. Last, but not least: Die extensive Kapazität der Server-Farm von Google, die an das historische Vorbild der Googol-Zahl erinnert, braucht es auch aus einem weiteren Grund.

Seit einiger Zeit erfassen die automatischen Suchroboter von Google nämlich nicht bloß den ausgedehnten Text-Dschungel des Internet, sondern zu allem Überfluß auch noch die Bilder-Landschaften des World Wide Web - gegenwärtig hat Google an die 400 Millionen Internet-Bilder bereits in seinem Index erfaßt. Und da Google, anders als die meisten Mitbewerber, nicht nur den jeweiligen Link indiziert, sondern zugleich auch eine reduzierte Archivkopie der Texte und Bilder anlegt, wächst der Speicherbedarf logischerweise in einer steilen Kurve.

Genau diese aufwendige Archivierung wiederum erschließt einen weiteren Teil des Erfolgsgeheimnisses von Google: Tritt der gar nicht so seltene Fall ein, daß die indizierte Website aktuell nicht am Netz verfügbar ist, kann der Benutzer alternativ auf die Archivkopie von Google zurückgreifen. Kurz: die Suchmaschine profilierte sich gerade mit diesem raren Feature zum kollektiven und historischen Gedächtnis des Internet.

Weiß man um diese Anhäufung von computerischen Kapazitäten, die hinter jeder erfolgreichen Websuche via Google samt dem dafür erforderlichen Finanzierungsbedarf steht, dann ist man fürbaß erstaunt von der Hartnäckigkeit und Unbefangenheit, mit der das Google-Team seit der Gründung im Jahr 1998 seinen unabhängigen Kurs verfolgen konnte.

Daß die bewußte Absenz von der Börse seinen erfreulichen Teil dazu beitragen konnte, ist klar: "Wir glauben, daß wir unser Unternehmen besser ausbauen und zu größeren Umsätzen bringen können, wenn wir keine Rücksicht auf Investoren und den Aktienkurs nehmen müssen", verriet der Google-Begründer Sergey Brin der "Financial Times" Deutschland Mitte 2002. Und fügte einen ebenso lakonischen wie selbstbewußten Nachsatz hinzu: "Im übrigen produzieren wir Cash, wir brauchen kein Geld von der Börse."

Nähere Details zum Betriebsergebnis sind den Google-Chefs nicht zu entlocken. Mehr als die Behauptung, man sei seit Anfang 2001 bereits operativ profitabel oder daß Google im Jahr 2002 Umsatz wie Gewinn mehr als verdoppeln habe können, kommen den Firmenchefs nicht über die Lippen.

Unstrittig in der Finanz- Fachwelt ist jedoch, daß Google als eines der wenigen Internet-Unternehmen über sprudelnde Einnahmequellen verfügen muß: Nach einem im vergangenen Jahr erfolgten Deal mit America Online, bei dem AOL sowohl die Suchtechnologie als auch die Anzeigentechnik bei Google geordert hatte, schätzen Wallstreet-Analytiker allein das Vertragsvolumen dieses Geschäfts auf 60 bis 100 Millionen Dollar. Wie gesagt: Alles reine Spekulation.

Faktum ist: Google will derzeit nicht an die Börse und hält dennoch heute nebst einem ansehnlichen Maschinenpark bei über 500 gutbezahlten Mitarbeitern. Und baut weiter rasant aus: Google-Abfragen können bereits auf 36 "nationalisierten" Websites in 86 Sprachen abgerufen werden. Damit war Google laut Nielsen Ratings bereits Mitte 2002 die weltweit fünftgrößte Internet-Site. Trotz dieses Aufwandes soll Google für Otto Normalbenutzer weiter kostenlos bleiben. Nicht einmal eine Besserplazierung zahlungskräftiger Kunden im Such-Ranking hat der Google-Vorstand bisher erwogen.

Im Unterschied zu wesentlich "lockerer" damit umgehenden Konkurrenten wie MSN oder Altavista sind bezahlte Werbelinks bei Google (geschätztes Volumen 2002: fast 100 Millionen Dollar) eindeutig als solche erkennbar vom Suchergebnis getrennt und unaufdringlich dar-gestellt. Ganz nebenbei verkauft Google, berichtet die deutsche "Wirtschaftswoche", um Summen bis zu einer halben Million Dollar seine Technologie an große Konzerne wie Sony, Cisco oder Procter & Gamble, die mittels der bewährten Suchwerkzeuge von Google ihre hauseigenen Datenbestände durchsuchen und systematisieren können.

Nun: Der Eigensinn der Googlianer, in ganz bestimmten Punkten nicht käuflich zu sein und stur an der strikten Neutralität der Ergebnisse festzuhalten, findet bei näherem Hinsehen eine nachhaltige und triftige Begründung. Und hat überdies massiv dazu beigetragen, daß Google binnen weniger Jahre allein durch Mundpropaganda (also in einer Art von vokalem Virus) von Benutzer zu Benutzer weiterempfohlen wurde.

Von Anfang an waren Brin und Page davon überzeugt, daß die Basiskonstruktion einer exzellenten Internet-Suche rein maschinell, sprich: von menschlicher Einflußnahme unbenommen sein sollte. Mitbewerber sahen dies ganz anders: Yahoo beispielsweise hatte schon von Beginn an auf eine von kundigen Mitarbeitern quasi händisch kompilierte Vorsortierung der Suchergebnisse gesetzt. Dort finden sich in diverse Kategorien geordnet jene Sites, die sich als vielbesucht und informativ herausgestellt haben.

Andere verwenden ein Verfahren, bei dem die maschinellen Trefferquoten mit einer human kompilierten Rangordnung ständig verglichen werden und daraus ein "kombiniertes Ranking" erstellt wird. Die Crux: Was die Handverleser bei Yahoo und Co als bedeutsam erachten, das muß ein wahrhaft neugieriges Individuum noch lange nicht befriedigen. Spätestens nachdem auch der Yahoo-Chef in CNN-Interviews von den Einnahmequellen geschwärmt hat, die sich aus der Besserplazierung finanzkräftiger Sponsoren für Yahoo ergäben, war für viele Internet-Freaks auch die Restmenge an "Objektivität" der Suchergebnisse in Frage gestellt. Sergey Brin und und Lawrence Page schufen dagegen eine gänzlich andere Suchmethode, die - wie sich in der Folge herausstellte - auch ohne fortgesetztes menschliches Zutun qualitativ hochwertige, präzise und damit wertvolle Ergebnisse liefert.

Google durchsucht das Netz nämlich nicht einfach nur nach simplen Worthäufigkeiten, die entweder rein quantitativ gelistet oder eben "nachbewertet" werden, sondern geht einen entscheidenden Schritt weiter: Jede Webpage, die das gesuchte Stichwort enthält, wird von Google auch daraufhin untersucht, welche anderen Seiten im Internet via Hyperlinks auf sie verweisen.

Vorausgesetzt werden dabei die unterschiedlichen Stufen der "Autorität" im Netz: Auf wen von vielen anderen, die ein ähnliches Thema behandeln, rückverwiesen wird, der muß genau für diese Wissensszene momentan von größerer Bedeutung sein. "Es gibt nicht zu viele Informationen in unserer Welt", ist Sergey Brin überzeugt, "sie sind nur schlecht organisiert."

Genial einfach eigentlich: Man überläßt die qualitative Bewertung von Informationen der verlinkten Struktur des Netzes selbst. Schön daran überdies: Wenn einmal die Klugheit (vorübergehend?) über die Käuflichkeit triumphiert. [*]

Jakob Steuerer ist unter der E-Mail-Adresse xs3@aon.at erreichbar.

Lesen Sie mehr zu diesen Themen:


Dieser Browser wird nicht mehr unterstützt
Bitte wechseln Sie zu einem unterstützten Browser wie Chrome, Firefox, Safari oder Edge.