Indexierung multimedialer Inhalte

Indexierung multimedialer Inhalte

Wie ich in einem Teil unserer Reihe "Architektur von Suchmaschinen" erklärt habe, kann Indexierung auch als "Schaffung durchsuchbarer Datenstrukturen" umschrieben werden. Die Indexierung von Webinhalten bezeichnet demnach den Vorgang, bei dem die Inhalte des Webs durchsucht und geordnet werden, um sie bei Bedarf den Usern zu präsentieren. Das hört sich zunächst einmal einfach an, ist in der Realität jedoch sehr kompliziert. Das liegt daran, dass die Inhalte ja erst einmal verstanden und im Idealfall auch interpretiert und überhaupt gelesen werden müssen, um sie vernünftig in einen Index zu bringen, der durchsucht werden kann. Da die großen Suchmaschinen darauf basieren, dass sie die Webinhalte automatisch indexieren, stehen sie vor anderen Problemen, als zum Beispiel manuell arbeitende Webkataloge. Menschen können verschiedene Inhalte...