"Zoetrope" für Blick in Web-Vergangenheit:
Suchmaschine soll alte Inhalte durchforsten

Forscher an der University of Washington (UW) arbeiten an einer Anwendung namens "Zoetrope", die neue Möglichkeiten bei der Web-Suche verspricht. Das Werkzeug ist dazu gedacht, nicht einfach aktuelle Inhalte im Web zu finden, sondern in der Vergangenheit dynamisch veränderlicher Webseiten nach Daten zu forschen. "Zoetrope lässt User dabei Informationen tatsächlich im Kontext einer Webseite suchen", betont UW-Computerwissenschaftler Eytan Adar. Die Entwicklung setzt dazu auf regelmäßige Schnappschüsse von Webseiten als Datenquelle. Sie soll sich aber deutlich von bisherigen Angeboten zur Nachforschung im historischen Web wie der Wayback Machine des Internet Archive abheben.

Im modernen Web sehen User nur den aktuellen Ist-Zustand von Webseiten, in dem mit verschiedensten Werkzeugen Daten gesucht, manipuliert und visualisiert werden können. "Da ist es schon irgendwie überraschend, dass es keine vergleichbaren Möglichkeiten für das vergängliche Web gibt", meint Dan Weld, Professor für Computerwissenschaften an der UW. Das wollen die Forscher mit Zoetrope ändern und dabei auch deutlich über einfache Stichwortsuchen hinaus gehen. "Bei Zoetrope kann der User Lupen auf Bereiche der Webseite zeichnen, um dadurch Fragen zu historischen Inhalten zu stellen", erklärt Adar. Wer sich etwa für Verkehrsentwicklung interessiert, könne leicht alte Versionen einer entsprechenden Website ansehen und die Daten auch visualisieren. Auch ein Quervergleich verschiedener Webseiten ist mit Zoetrope möglich, beispielsweise von Öl- und Benzinpreisen mit entsprechenden Nachrichtenmeldungen.

Stündlich Momentaufnahmen von 1.000 Webseiten
Die Forscher hoffen, Zoetrope bereits im kommenden Sommer frei verfügbar machen zu können. Die historische Web-Suche soll möglichst als Browser-Plug-in oder Software-as-a-Service angeboten werden. "Das ideale Anwendungsszenario wäre, dass User ganz normal im Web surfen und bei Bedarf Fragen zu historischen Informationen stellen können, ohne den Browser zu verlassen", erklärt Adar. Vorstellbar ist den Forschern zufolge beispielsweise ein Schieberegler, mit dem Nutzer einfach immer weiter in die Vergangenheit einer Webseite spähen können. Derzeit speichert Zoetrope stündlich Schnappschüsse von rund 1.000 verschiedenen Webseiten. Adar will eruieren, wie das Programm auf das gesamte Web ausgeweitet werden kann und arbeitet auch daran festzustellen, wie regelmäßig verschiedene Seiten gespeichert werden müssen. Langfristig könnte Zoetrope das aufgrund der Aktualisierungsfrequenz von Webseiten automatisch bestimmen.

Eine Einschränkung von Zoetrope ist, dass erst seit rund vier Monaten Daten gesammelt werden. "Wir würden sehr gerne Zoetrope mit den Daten der Wayback Machine integrieren", meint Adar. Es müssten aber wohl diverse Copyright-Fragen geklärt werden, um diesen Datenschatz nutzen zu können. Das Internet Archive sammelt bereits seit 1996 historische Webdaten und hat Schnappschüsse von 85 Mrd. Webseiten, die im heutigen Web teils gar nicht mehr existieren. Ein wirklich effizientes Werkzeug zum Durchforsten und Auswerten dieser Datensammlung ist die Wayback Machine allerdings nicht, da sie lediglich den Aufruf einzelner Schnappschüsse einer bekannten URL erlaubt. (pte/red)