Architektur von Suchmaschinen: Suchanfragen verarbeiten

Heute komme ich zum letzten Teil unserer Reihe „Architektur von Suchmaschinen“. Von den drei Funktionen der Suchmaschinen – der Datengewinnung, der Datenverwaltung und Analyse und der Verarbeitung von Suchanfragen – habe ich bisher die ersten beiden Funktionen behandelt. Mit Hilfe des sogenannten Webcrawler-Systems gewinnen die Suchmaschinen die für sie notwendigen Daten. Diese werden dann im Information Retrieval System zu nützlichen Informationen zusammengefasst und ausgewertet. Am Ende dieses Prozesses, der Indexierung, steht eine Datenstruktur, die eine schnelle und im Idealfall passende Antwort auf Suchanfragen möglich machen kann. Die Anfragen werden vom Nutzer gestellt, innerhalb der Suchmaschine ist es dann der Query-Prozessor, der für die Verarbeitung der Benutzeranfrage zuständig ist und somit die dritte Funktion von Suchmaschinen erfüllt.

Der Query-Prozessor

Der Query ist erstens dafür zuständig, die Suchanfrage des Nutzers zu verarbeiten. Er gibt diese Anfrage also weiter an den Index im Information Retrieval System. Dieser liefert dem Query-Prozessor dann alle Ergebnisse, die sich in seinem Datenbestand befinden. Die Ergebnisse werden jedoch nicht einfach so an den Benutzer weitergegeben, denn der Query-Prozessor ordnet die Ergebnisse und bringt sie in eine Reihenfolge. Erst danach erhält der User eine nach Relevanz sortierte Ergebnisliste.

Wie aber gelangt der Query-Prozessor zu dieser Reihenfolge? Dies ist sicherlich eine der wichtigsten Fragen im Bereich der Suchmaschinenoptimierung. Vermutlich sogar die wichtigste, die wahrscheinlich niemals vollständig beantwortet werden kann, außer von den einzelnen Suchmaschinenbetreibern selbst. Ganz allgemein gesagt, arbeiten alle Suchmaschinen mit bestimmten Algorithmen, die die Ergebnislisten nach bestimmten Kriterien berechnen. Hierbei werden bis zu 100 verschiedene Gewichtungskriterien angewandt. Die notwendigen Informationen dafür erhält der Query-Prozessor wiederum vom Information Retrieval System.

Zu den wichtigsten Algorithmen die als Rankingmodelle dienen, gehören  der Pagerank-Algorithmus von Google und das Konzept der Hubs & Authorities. Beide Konzepte basieren auf der Bewertung von Verlinkungen von Websites untereinander, wobei Hubs & Authorities als das mathematisch ausgereiftere Konzept gilt und somit als Erweiterung und Ergänzung zum Pagerank-Konzept gesehen werden kann. Auf den Pagerank von Google und seine Relevanz für das Rating sind wir unter anderem in diesem Beitrag schon einmal eingegangen. Allerdings ist fraglich, inwieweit dieses Konzept noch in die Gewichtung beziehungsweise das Rating einfließt.

Rankingfaktoren

Wie ich etwas weiter oben bereits erwähnt habe, fließen bis zu 100 Kriterien in das Rating der Suchmaschinen ein. Es wäre also übertrieben, hier alle zu nennen, zumal es wohl auch nicht möglich wäre, da die genauen Faktoren – ebenso wie ihre Gewichtung – zu den Geheimnissen der einzelnen Suchmaschinenbetreiber gehören. Qualität und Anzahl der Verlinkungen gehören allerdings nach wie vor dazu. Eine immer größere Bedeutung spielt außerdem die Qualität des Inhalts einer Website. Ebenfalls wichtig ist die Auswahl der Keywords. Hier spielt nicht nur ihre Häufigkeit mit der sie im Text vorkommen, die Keyword-Density, eine Rolle, sondern auch die Häufigkeit mit der diese Begriffe generell auf Websites auftauchen, also die Qualität des Keywords. Ein gutes Keyword wäre demnach ein Begriff, der auf möglichst wenigen Websites auftaucht, dafür aber auf Ihrer Website häufiger zu finden ist.

Dies waren nur einige Beispiele für Rankingfaktoren, auf weitere werde ich nicht weiter eingehen. Manche werden Ihnen in anderen Beiträgen in unserem Blog (wieder-)begegnen. Für die Suchmaschinenoptimierung Ihrer Seite macht es ohnehin nur Sinn individuell zu betrachten, welche Faktoren beachtet werden müssen und welche vernachlässigbar sind.

Personalisierung der Suchergebnisse

Einen weiteren Punkt möchte ich allerdings noch erwähnen, der zwar nicht direkt zu den internen Rankingfaktoren zählt, aber trotzdem eine immer größere Rolle spielt: Soziale Faktoren. Im Internet ist eine immer stärker werdende Personalisierung von Inhalten feststellbar. Dieser Trend wurde mittlerweile auch von den Suchmaschinen übernommen. So liefert Google beispielsweise Ergebnisse, die von den Interessen des jeweiligen Nutzers abhängen. Dies stellt die Suchmaschinenoptimierung natürlich vor neue Probleme.

David Linden 178 posts

Autor

Man findet mich auf Google+

1 Kommentar

  • [...] Im siebten und letzten Beitrag der Serie wird dann die dritte und letzte Funktion der Suchmaschine erläutert, nämlich die Verarbeitung der vom Nutzer gestellten Suchanfrage. Dafür ist der Query-Prozessor zuständig, der über das invertierte Dateisystem erst einmal alle zu den Suchbegriffen passenden Dokumente findet und diese dann anhand vieler verschiedener Kriterien einordnet. Die dafür notwendigen Algorithmen die dann tatsächlich die relevantesten unter den Dokumenten finden sind das Herzstück der Suchmaschinenbetreiber. Googles Pagerank-Algorithmus hat beispielsweise maßgeblich zum Erfolg von Google beigetragen. In diesem letzten Teil werden einige der wichtigsten Rankinfaktoren genannt. [...]

Leave a Reply

Rules of the Blog
Do not post violating content, tags like bold, italic and underline are allowed that means HTML can be used while commenting. Lorem ipsum dolor sit amet conceur half the time you know i know what.

Loading Facebook Comments ...

No Trackbacks.