Die richtige Verwendung von XML-Sitemaps (sitemaps.xml)

Wie wir bereits im Artikel „Was ist eine Suchmaschine?“ angedeutet haben, ist der Vorgang des Crawlings, also der Erfassung aller Unterseiten einer Internetpräsenz, ein äußerst komplexer und aufwändiger Vorgang. Da alle Suchmaschinenbetreiber sich darüber im Klaren sind, haben sie sich darauf geeinigt einen gemeinsamen Standard zu entwickeln, der das Auffinden der relevanten Inhalte einer Internetpräsenz vereinfachen und beschleunigen soll: Die XML-Sitemaps.

Was ist eine XML-Sitemap?

Hierbei handelt es sich um einfach strukturierte XML-Dateien, die alle Seiten der eigenen Internetpräsenz auflisten. Google und zwischenzeitlich auch Bing laden dann diese Datei herunter und analysieren sie. Folgende Daten sind dabei enthalten:

  1. die Adresse der Seite
  2. die Änderungsfrequenz (wie häufig wird diese Einzelseite aktualisiert)
  3. das Änderungsdatum
  4. die Wichtigkeit dieser Seite aus Sicht des Betreibers

Wie ist eine XML-Sitemap aufgebaut?

Eine einfache XML-Sitemap Datei sieht so aus:
 <?xml version=“1.0″ encoding=“UTF-8″?>
 <urlset xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance“ xsi:schemaLocation=“http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd“ xmlns = „http://www.sitemaps.org/schemas/sitemap/0.9“>
<url>
<loc>http://www.seosweet.de/blog/2011/07/05/die-wichtigsten-suchmaschinen/</loc>
<lastmod>2011-07-04T18:57:33+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>

Die erste Zeile zeigt, dass es sich um eine XML-Datei handelt. Die zweite Zeile besagt, dass es sich um eine Auflistung von Internetadressen im XML-Sitemap Format handelt. Unterhalb des Urlset Elements kann eine nahezu beliebige Anzahl von URL-Elementen platziert werden. Diese bestehen aus den Elementen loc für die Adresse der Seite, lastmod für das Änderungsdatum, changefreq für die Änderungsfrequenz (zugelassene Werte sind always [ständig], hourly [stündlich], daily [täglich], weekly [wöchentlich], monthly [monatlich], yearly [jährlich], never [nie]), sowie priority für die selbstgewählte Wichtigkeit.

Die Priority wird mit einem Wert zwischen 0.0 (unwichtig) und 1.0 (wichtig) angegeben. Der Wert 1.0 sollte ausschließlich für die Startseite Ihrer Webpräsenz verwendet werden, es sei denn irgendeine Ihrer Unterseiten ist wichtiger als die Startseite. Dies dürfte allerdings nur in den seltensten Fällen zutreffend sein.

Was sind die Vorteile einer XML-Sitemap?

Der allerwichtigste Vorteil von XML-Sitemaps besteht in der Vollständigkeit der Indexierung, insbesondere bei größeren Internetpräsenzen. Dadurch finden Google und die anderen Suchmaschinen wirklich alle Seiten Ihrer Internetpräsenz. Wenn Sie mit mehr Inhalten in den Suchmaschinen vertreten sind, steigen auch Ihre Chancen gefunden zu werden entsprechend.

Ein weiterer entscheidender Vorteil ist die Geschwindigkeit der Indexierung. Unsere Messungen haben ergeben, dass frisch publizierte Seiten, wenn eine XML-Sitemap vorhanden ist, ca. ein bis zwei Minuten nach deren Veröffentlichung im Google Index zu finden sind. Dies ist auf den Umstand zurückzuführen, dass Google nun nicht mehr alle Seiten Ihrer Internetpräsenz auswerten muss um festzustellen, ob und was sich geändert hat, sondern einfach in der XML-Sitemap nachschauen kann.

Wie wird die XML-Sitemap erstellt?

Hierfür gibt es mehrere Möglichkeiten. Sie können die Sitemap in einem herkömmlichen Texteditor verfassen und auf Ihren Webserver hochladen. In den seltensten Fällen werden Sie allerdings die Sitemap manuell erstellen wollen. Viele Content Management Systeme bieten Plugins zur Generierung der Sitemaps. Hier finden Sie eine Auflistung von Plugins für gängige Content-Management-Systeme:

Wie wird die XML-Sitemap den Suchmaschinen bekannt gemacht?

Auch hierfür gibt es unterschiedliche Möglichkeiten. Die einfachste Variante besteht darin, die Sitemap in die robots.txt einzutragen. Erstellen Sie hierzu einfach einen Eintrag mit der Zeile:

Sitemap: http://www.meineseite.de/sitemap.xml

Wenn Sie die Sitemap durch ein Plugin generieren lassen, wird dieser Punkt in der Regel automatisch erledigt.

Zudem kann die Sitemap bekannt gemacht werden indem sie in den Webmastertools von Google eingetragen wird. Dadurch wird sie von Google direkt gefunden. Auf die anderen Suchmaschinen hat das zwar selbstverständlich keinen Einfluss, es ist jedoch trotzdem in jedem Fall empfehlenswert diesen Schritt auszuführen. Loggen Sie sich hierzu in den Google Webmaster Tools mit Ihren Zugangsdaten ein. Die XML-Sitemap können Sie dann im Menüpunkt Website-Konfiguration XML-Sitemaps einreichen.

Am Rande sei noch erwähnt, dass es weitere Varianten von XML-Sitemaps für spezielle Arten von Inhalten gibt. Google unterstützt derzeit Sitemaps für:

  • Videoinhalte
  • Mobilinhalte wie Handy-Websites
  • News
  • Geodaten
  • Google Codesuche
  • Bilder

Jakob Holterhöfer 51 posts

Jakob hat Seosweet gegründet und zeichnet sich verantwortlich für die Softwareentwicklung.

13 Kommentare

  • Andi Petzoldt (6 Jahren ago) Reply

    Danke für den Beitrag. Ich habe noch eine kleine Anmerkung dazu:
    Viele SEO's verwenden einen anderen Pfad als "/sitemap.xml" und tragen diese auch nicht in die robots.txt ein, um Mitbewerbern das Analysieren des eigenen Projekts zu erschweren. Ich persönlich teile diesen Ansatz nicht, aber man weiß ja nie, was manche Leute zu verbergen haben ;)

  • [...] XML-Sitemaps die Indexierung erleichtert, haben wir bereits ausführlicher in dem Beitrag “Die richtige Verwendung von XML-Sitemaps” [...]

  • [...] zu tun, wie das ein menschlicher Nutzer kann. Auf dieses Problem und seine Lösung sind wir u.a. in unserem Beitrag zu den XML-Sitemaps eingegangen. Dennoch ist das Crawling insgesamt ein hoch komplizierter Prozess, an dem alle in [...]

  • [...] sich in der Regel innerhalb weniger Tage in den Suchergebnissen nieder. Mit einer gut gepflegten XML-Sitemap teilweise binnen [...]

  • [...] erstellt werden ist die Bezeichnung als XML-Sitemap üblicher. Zu diesen XML-Sitemaps hat Jakob auch schon einen Beitrag geschrieben und sehr gut erklärt wozu sie da sind, wie man sie verwendet und wie man eine XML-Sitemap [...]

  • [...] für Suchmaschinen bilden die schon häufiger erwähnten Sitemaps, insbesondere die XML-Sitemaps. Darunter gibt es dann wieder die speziellen XML-Sitemaps, die hervorragend dazu geeignet sind, [...]

  • Lothar Seifert (5 Jahren ago) Reply

    Danke für den Artikel. Gibt es eine Begrenzung, was die Anzahl der Seiten in einer sitemap.xml betrifft und sollte man dann die Sitemap in mehrere aufteilen?

  • admin (5 Jahren ago) Reply

    @Lothar
    Für XML-Sitemaps gelten zwei Beschränkungen:

    - Sie dürfen nicht mehr als 50.000 Einträge enthalten

    - Sie dürfen nicht mehr als 10MB groß sein

    Um dieses Problem zu umgehen, können sitemap-index Dateien angelegt werden. Google beschreibt dies in der Webmaster-Central:

    http://support.google.com/webmasters/bin/answer.py?hl=de&answer=71453

    Der Index unterliegt der gleichen Beschränkung wie die regüläre Sitemap (50.000 Einträge)

    Auf diese Weise sind 50.000 * 50.000 = 2,5 Mrd. URL´s möglich. Außerdem lässt sich nicht nur eine Sitemap an Google übermitteln, wodurch es faktisch keine reelle Beschränkung hinsichtlich der Anzahl gibt.

  • Lothar Seifert (5 Jahren ago) Reply

    Hallo,

    vielen Dank für die umfangreiche Antwort. Viele Grüße

  • Lothar Seifert (5 Jahren ago) Reply

    Hallo, kennt jemand ein Programm, mit dem eine spezielle Sitemap nur für Bilder erstellt werden kann?

    Kann es ein Problem geben, wenn die Bilder mit in der Sitemap für die Links aufgeführt sind? Da stehen sie unter und nicht unter und werden sicherlich nicht indexiert.
    Viele Grüße

  • [...] spielen eine wichtige Rolle dabei, den Suchmaschinen die Website zugänglich zu machen, sofern sie richtig verwendet werden. Die robots.txt kann für die Crawler allerdings leicht zu einem ungewollten Hindernis werden, wenn [...]

  • Jens (4 Jahren ago) Reply

    Die Sitemap kann man auch direkt über den Browser bekannt machen. Einfach in der Url Eingabemaske eingeben:

    http://www.google.com/webmasters/tools/ping?sitemap=http://www.dieseite.de/sitemap.xml

    Wobei dieseite.de mit der eigentlichen Webseite ersetzt werden sollte.

  • […] bei tiefen Websites muss man jedoch nicht auf eine schnelle Indexierung verzichten, wenn man die obligatorische XML Sitemap einbaut. Sie vereinfacht es den Crawlern, alle vorhandenen Unterseiten auch zu finden. Für den User […]

Leave a Reply

Rules of the Blog
Do not post violating content, tags like bold, italic and underline are allowed that means HTML can be used while commenting. Lorem ipsum dolor sit amet conceur half the time you know i know what.

Loading Facebook Comments ...

No Trackbacks.