Top-Secret: Alles über die neue Google-Suchmaschine

Entweder haben die Burschen verdammtes Glück. Oder sie sind verdammt viel klüger als wir alle. Vor einem Monat noch redete sich die Welt den Mund fusselig über den kommenden Börsengang von Google. Er sollte im April stattfinden, 5 Milliarden in die Kasse spülen und so die weitere Expansion finanzieren.

Und jetzt? Jetzt pfeift Google auf die Börse, zahlt sich die Expansion aus der Handschatulle und gibt Gas, dass dem Rest der Welt Hören und Sehen vergeht. Die Suchmaschine wurde durchlüftet, dramatisch ausgebaut (mehr Bilder, mehr Dokumente, mehr Forenbeiträge), funktioniert jetzt besser. Und wichtig: hat viel weniger Spam.

Nur eines ist wie vor einem Monat: Schweigen. Offizielle Bestätigung für das Tuning: Fehlanzeige. Google sagt nix. Alles geheim. Oder doch nicht?

Zu Jahresbeginn sah es so aus, als käme der Internet-Darling Google erstmals in Bedrängnis. Yahoo (kaufte in den letzten 14 Monaten Such-Technologie um 2 Milliarden Dollar) kündigte an: "Wir wollen Nummer 1 werden." Fast gleichzeitig gab Bill Gates grünes Licht für den Aufbau einer neuen Microsoft-Suchmaschine.

So was sieht wohl anders aus. Google Anfang März 2004. Das liest sich eher wie eine neue Heldensaga:

  • 6 Milliarden Dokumente: Die Zahl der gelisteten Items, in denen Google sucht, wurde dramatisch nach oben geschraubt. Statt 3,2 Milliarden durchackert Google nun 4,28 Milliarden Seiten. Gesamt werden nun 6 Milliarden Dokumente gelistet.
  • 880 Millionen Bilder: Dasselbe bei Fotos. Rauf mit dem Datenbestand um mehr als das Doppelte. Google durchsucht nun 880 Mio. Bilder statt wie bisher 400 Mio.
  • 845 Mio. Forenbeiträge: In den Google Groups stehen nun 845 Millionen Usenet-Beiträge, die bis ins Jahr 1994 zurückreichen.

Neue Suchmethode
Noch viel einschneidender ist, was im Hintergrund passiert. In den letzten Wochen hat Google seine Suchtechnologie radikal geändert. Dabei kommt künstliche Intelligenz genauso zum Einsatz wie ein völlig neuer Algorithmus, der die Reihung der Suchergebnisse maßgeblich beeinflusst.

Offensichtlich bringt Google seit der großen "Aufräumaktion" die CIRCA-Technologie zum Einsatz. Heißt im Klartext: Die Suche wird durch Einsatz eines "denkenden" Systems aus dem Gebiet der künstlichen Intelligenz um einen Riesenschritt nach vorne gepusht. CIRCA baut auf einer mehrere Millionen Wörter umfassenden Ontologie auf, einem System, das die Beziehungen zwischen Dingen definiert. Und es erkennt die inhaltliche Bedeutung einer Webseite.

Es versteht den Inhalt einer Internet-Site nicht im menschlichen Sinne, aber es ist in der Lage, alle für den Inhalt wichtigen Wörter herauszufiltern. Diese Sammlung von Wörtern wird dann mit allen anderen Webseiten im Internet verglichen. Findet das System andere Seiten, auf denen die gleichen Wörter vorkommen, ist also klar, dass es sich dabei um Verwandtes handelt ...

Die ganze Story finden Sie in E-MEDIA Nr. 05/04!