Search Engines
This article is in German.English information:
The Anatomy of a Large Scale Hypertextual Web Search Engine
von Sergey Brin und Lawrence Page
Maßgeblich für den Erfolg einer Suchmaschine ist in erster Linie die Qualität der Suchergebnisse. Nur eine Suchmaschine, die sinnvolle und relevante Ergebnisse liefert und nicht (von zweifelhaften Anbietern) beliebig manipuliert werden kann, wird auf Dauer von den Nutzern akzeptiert. Alle heute erfolgreichen Suchmaschinen nutzen Verfahren, die eine objektive Einschätzung der Relevanz einer Website ermöglichen sollen.Praktisch alle Suchmaschinen nutzen aus naheliegenden Gründen das Vorkommen eines Suchbegriffs in den Inhalten einer Seite, die Keyword-Dichte (Häufigkeit des Vorkommens) und die Stellen des Vorkommens als Maßstab für die Relevanz. Um Suchmaschinen gegen Manipulationen der Websiteinhalte resistent zu machen, wurde sehr bald die Linkpopularität (Anzahl eingehender Links) als Kriterium herangezogen. Dem liegt die Überlegung zugrunde, dass wichtige Dokumente häufiger verlinkt sind als unwichtige. Aber auch dieses Kriterium konnte durch findige Websitebetreiber überwunden werden.
Zu den Vorreitern bei der Entwicklung von verläßlichen, nicht manipulationsanfälligen Algorithmen zählen Lawrence Page und Sergey Brin, zwei ehemalige Studenten der Standford University und Gründer von Google. Ihre Veröffentlichung kann exemplarisch einen Einblick in die ständig verbesserten und zum Teil geheimen Methoden der Relevanzbewertung (Ranking) geben. Das Verfahren von Page und Brin nutzt nicht die absolute Anzahl eingehender Links. Vielmehr definiert sich die Relevanz einer Website stets rekursiv aus der Relevanz der auf sie verweisenden Websites. Die Relevanz einer Seite definiert sich also über die Relevanz der auf sie verweisenden Seiten und deren Relevanz definiert dich ihrerseits über die Relevanz der auf sie verlinkenden Seiten. Das Verfahren kann prinzipiell duch den folgenden Algorithmus beschrieben werden:
Beispiel: Die Seiten B und C verweisen auf die Seite A. Durch einen ausgehenden Link "vererbt" die Seite B Ihre Relevanz an die Seite A und weitere verlinkte Seiten, wobei die Gesamtrelevanz der Seite B auf alle verlinkten Seiten aufgeteilt wird, indem ihre Relevanz durch die Anzahl der in ihr enthaltenen Links geteilt wird. Seite C verfüge nur über einen einzigen Link, wodurch ihre Gesamtrelavanz an A vererbt wird. Die zu vererbenden Relevanzanteile werden über alle verlinkenden Seiten, also B und C, addiert, gehen dann aber nur zu einem Teil auf die Seite A über. Wie hoch der Grad der Weitergabe der Relevanz tatsächlich ist, wird über den Dämpfungsfaktor (die "Erbschaftssteuer") festgelegt.
Die tatsächlichen Implementierungen in Suchmaschinen werden deutlich komplexer ausfallen und Veränderungen unterliegen. Zum Beispiel werden in der Praxis wohl auch die Position und Prominenz eines Links, die Distanz zwischen Websites und die Aktualität der verweisenden Seite Einfluss auf die Gewichtung haben. Auch berücksichtigt die oben gezeigte Formel nicht den Grad der Einbindung in das WWW (etwa das Vorhandensein ausgehender Links).
Auf der Grundlage dieser grundsätzlichen Annahmen kann ein Websitebetreiber in einem gewissen Rahmen günstige Voraussetzungen dafür schaffen, dass eine Website einen angemessenen Platz in den Suchmaschinen findet. Dieses legitime Anliegen wird von den Suchmaschinen durchaus unterstützt. So werden zum Beispiel Methoden bereit gestellt, mit denen ein Websitebetreiber sicher stellen kann, dass die Inhalte von der Suchmaschine richtig erfasst werden.
Einige sogenannte Suchmaschinenoptimierer haben sich hingegen zum natürlichen Feind der Suchmaschinen entwickelt. Sie erzeugen in Suchmaschinen durch gezielte Manipulationen ein falsches Abbild der Realität. Vor diesen Methoden sei hier ausdrücklich gewarnt: erstens arbeiten Suchmaschinen ständig daran, zeitweilig erfolgreiche Manipulationen zu neutralisieren, zweitens gehen Suchmaschinen zunehmend dazu über, allzu dreiste Manipulationen durch Löschung aus dem Index oder eine schlechtere Einstufung zu "bestrafen".
Search Engine Optimizers
Google-Informationen für Webmaster

