Architektur von Suchmaschinen – Review

blog-1-img-2372
23 Aug

Architektur von Suchmaschinen – Review

Im Herbst 2011 habe ich mir für die Serie, um die es heute geht, so viel Mühe gegeben, dass es sich durchaus lohnt sie noch einmal "Review" passieren zu lassen. Schlechte Wortspiele waren damals übrigens nicht Teil der Serie, vielmehr handelte es sich dabei um ein sehr grundlegendes Thema für die Suchmaschinenoptimierung. Denn es ging generell darum, wie Suchmaschinen funktionieren. Dementsprechend hieß die Serie dann...

Architektur von Suchmaschinen: Keywordgewinnung

Der heutige Artikel aus unserer Reihe zur Suchmaschinenarchitektur wird sich erneut dem Information Retrieval System widmen. Im letzten Beitrag zur Wort-und Sprachidentifikation habe ich darauf hingewiesen, dass sich dieses System allgemein in drei Komponenten aufteilen lässt: die Datennormalisierung, die Dokumentenanalyse und die Schaffung durchsuchbarer Datenstrukturen (Indexierung). Auch möchte ich noch einmal an die Frage erinnern, die ich im letzten Artikel gestellt habe und an der sich auch der heutige Beitrag orientiert: Wie gelingt es den Suchmaschinen vollautomatisch, also ohne menschliche Hilfe, Internetseiten zu verstehen und so zu ordnen, dass bei einer Abfrage passende und sinnvolle Ergebnisse anzeigt werden können? Hierzu wurden beim letzten Mal bereits erste Antworten geliefert. Von den sechs Prozessen, die hierbei im Rahmen der Datennormalisierung und der...