WDF*P*IDF – die neue Keyword Density?

In einem Beitrag zur SEO-Textoptimierung von vergangener Woche habe ich diesen Artikel bereits angekündigt. WDF*P* IDF ist zur Zeit der Star in der deutschen SEO-Szene und wird in vielen SEO Blogs gehyped – und in allen relevanten zumindest thematisiert. Da wir natürlich auch relevant sind, machen wir das jetzt ebenfalls. Zwar möchte ich mich nicht unbedingt am Hype beteiligen, aber die Thematisierung ist schließlich doch wichtig, zumal WDF*P*IDF bereits als die neue Keyword Density gefeiert wird.

Was ist WDF*P*IDF ?

Der Term WDF*P*IDF dient im Grunde dazu, die Relevanz eines Keywords zu beschreiben. Das geschieht auf Grundlage zweier Kriterien: Einmal wird dieRelevanz eines Keywords innerhalb eines Texts / Dokuments / einer Internetseite (WDF) beurteilt und andererseits die Relevanz dieses Keywords in Bezug auf alle vorhandenen Dokumente (IDF). Eigentlich geht es hierbei natürlich um Häufigkeiten. WDF steht schließlich für Within Document Frequency, was nunmal Häufigkeit (eines Terms / Worts / Keywords) innerhalb des Dokuments bedeutet. WDF ist also vom Prinzip her nichts anderes als die schnöde olle Keyword Density, allerdings logarithmiert, was das Ganze ein wenig eleganter erscheinen lässt. Aber der Logarithmus erfüllt auch einen wichtigen Zweck: Durch ihn wird nämlich die Gewichtung besonders häufig vorkommender Terme gedämpft.

IDF steht für Inverse Document Frequency und beschreibt den Anteil (wieder logarithmiert) der Dokumente bzw. Internetseiten, die ein bestimmtes Wort enthalten, bezogen auf alle bekannten Dokumente. Der Wert wird allerdings sozusagen “falschrum” berechnet, sodass die Anzahl aller Dokumente  durch die Anzahl der Dokumente geteilt wird, in denen das bestimmte Wort vorkommt. Im Ergebnis werden die Werte dadurch umso größer, je seltener es Dokumente gibt, die das Wort enthalten.

Werden diese beiden Werte dann miteinander multipliziert – das P in der Gleichung stellt lediglich einen Korrekturfaktor dar, auf den ich jetzt nicht weiter eingehe – ergibt sich schließlich ein Maß für die Relevanz eines Keywords, generell verknüpft mit der Bedeutung des Keywords für das untersuchte Dokument. Dahinter stehen die Annahmen:

1. dass ein Keyword, welches in einem Dokument häufig vorkommt, von großer Bedeutung für das Thema des Dokuments ist und somit seinen Inhalt gut beschreibt.

2. dass ein Keyword, das in fast jedem Dokument vorkommt, keine größere Relevanz für ein spezielles Thema hat, sodass im Umkehrschluss Keywords, die nur in wenigen Dokumenten vorkommen, offensichtlich eine spezifische und hohe Bedeutung für das Thema haben.

Zusammengefasst: Ein Keyword, das in einem Dokument häufig, in allen anderen Dokumenten aber selten vorkommt, erhält einen hohen Wert.

Wer Genaueres insbesondere zu den mathematischen Aspekten nachlesen möchte, sollte dies bei Karl Kratz tun, der das ganze Thema erst so richtig losgetreten hat.

Was nützt WDF*P*IDF?

Das klingt zunächst alles nicht sooo kompliziert, ist es im Endeffekt aber dann doch. Man kann mit einem entsprechenden Tool die Werte für WDF*P*IDF für die Keywords auf seiner Seite berechnen. Das bringt aber erstmal gar nichts, denn eine solche Auswertung muss natürlich mit allen sinntragenden Wörtern des Textes geschehen bzw. der ganze Text muss ausgewertet werden. Das bringt dann aber trotzdem erstmal immer noch wenig, denn wir haben ja keinen Referenzwert und wissen nicht, welcher Wert nun gut ist und welcher nicht. Dazu muss dann auch der Content der Konkurrenten in den SERPs analysiert werden. Idealerweise natürlich vor allem der vorderen zehn. Dann erhält man eine Auswertung für jede untersuchte Website mit allen darin enthaltenen Keywords und den dazugehörigen Werten, also im Grunde eine Rangfolge der Keywords auf den untersuchten Websites. Legt man die Muster der Konkurrenten übereinander, erscheint im Idealfall eine einigermaßen gleiche Verteilung der Keywords und ihrer Häufigkeiten bzw. WDF*P*IDF-Werte. Eine gute Beschreibung wie so etwas funktioniert hat, übrigens Philipp Helminger im östereichischen Webmarketingblog geliefert.

Dann gilt es demnach die eigene Website zu untersuchen und die Keywords und Werte den vorderen Plätzen anzupassen, da man sich so ja theoretisch Googles Vorstellung einer sehr relevanten Seite für ein bestimmtes Keyword nähert. Eine Garantie für ein vorderes Ranking ist dieses Vorgehen allerdings nicht. Die meisten anderen Ranking-Faktoren bleiben unberücksichtigt und auch Synonyme für ein Keyword werden bei WDF*P*IDF nicht gemessen, obwohl das Thema der Semantik immer größere Bedeutung hat. Aber natürlich stellt diese relativ neue Methode einen weiteren Ansatz dar, Texte weiterhin zu optimieren.

Was ist mit der Keyword Density?

Die wird ja im Zusammenhang mit WDF*P*IDF ganz gerne totgeredet und geschrieben. Sie sei irrelevant und sowieso schon immer unnütz gewesen, wie Karl Kratz es geschrieben hat. Dem muss man natürlich nicht zustimmen. Ich würde das beispielsweise differenzierter sehen und habe meine Meinung dazu ja letzte Woche auch schon geäußert. In der Tat ist es Unsinn davon auszugehen, dass eine Keyword Density von fünf Prozent oder gar mehr in einem Text, diesen für das Keyword relevanter erscheinen lassen würden. Dass so etwas Leser und mittlerweile auch die Suchmaschinen nervt, ist hoffentlich schon länger bekannt. Wir empfehlen hier ja immer so um die zwei Prozent. Und ich habe zudem erwähnt, dass sich die Keyword Density natürlich auch hervorragend zur Kontrolle eignet, ob Wörter nicht doch zu häufig vorkommen und man vielleicht besser Synonyme verwendet, die wahrscheinlich ebenfalls als Keyword und auch als Rankingfaktor dienen. Außerdem ist ein Prozentwert, wie ihn die Berechnung der Keyword Density liefert, unter dem Gesichtspunkt der Usability und des Verständnisses für viele nicht ganz so professionelle Anwender deutlich geeigneter als ein logarithmierter Wert. Wenn man die Grenzen und die Schwächen der Keyword Density kennt, wird sie auch weiterhin ein durchaus nützliches Hilfsmittel bleiben. Außerdem kommt ja auch die neue Formel nicht ohne sie aus, nur verknüpft sie eben noch. Und ohne jetzt lange Eigenlob betreiben zu wollen, verweise ich an dieser Stelle nochmal auf unser Keyword Density Tool, das nicht nur die Keyword Density berechnet, sondern beispielsweise auch Synonyme vorschlägt und noch weitere nützliche Daten als Orientierungshilfe liefert.

WDF*P*IDF – Allheitmittel oder Hype?

Ich würde sagen weder noch. Der Hype momentan ist sicherlich übertrieben, manche wähnen sich sogar schon auf dem WEG hin zum idealen SEO-Text. Dabei ist natürlich die Frage: was ist denn ideal? Sind die ersten zehn Plätze wirklich ideal? Vielleicht übernimmt man ja auch Fehler, wenn man die WDF*P*IDF Werte der Vorderen als Maßstab nimmt. Deswegen sollte natürlich nicht alles genau nachgeahmt werden. Eine Orientierung bietet sich aber trotzdem immer an. Außerdem sollte man auch auf die anderen Rankingfaktoren achten. Meiner Meinung nach ist eine Methode wie WDF*P*IDF sowieso vor allem für ein hart umkämpftes Umfeld hilfreich, in dem es wirklich nur noch um Nuancen geht, bei denen sich kleine Unterschiede in der Textoptimierung unter Umständen stark auswirken können. Hier ist ein solches Werkzeug in der Tat sehr nützlich. Aber für viele andere reicht zur Textoptimierung sicherlich ein “einfaches” Keyword-Density-Tool weiterhin aus, wenn man es mit ein bisschen SEO-Gespür und gesundem Menschenverstand benutzt.

WDF*P*IDF ist insgesamt interessant, aber hochkomplex. Es bleiben auch noch viele Fragen offen, wie auch das SEO Book in einem sehr lesenswerten Beitrag beschreibt. Wie unterschiedlich die Relevanz des Themas in der SEO-Szene gesehen wird, zeigt eine kleine Umfrage von SEO United, bei der vier SEO-Profis ihre Meinung zum Thema abgegeben haben. Einig sind sie sich jedenfalls nicht. Wir dürfen gespannt sein, ob sich die neue Methode nun tatsächlich etabliert oder bald wieder verschwindet.

David Linden 178 posts

Autor

Man findet mich auf Google+

12 Kommentare

  • Harry (4 Jahren ago) Reply

    "Vielleicht übernimmt man ja auch Fehler, wenn man die WDF*P*IDF Werte der Vorderen als Maßstab nimmt."

    Genau das habe ich mir die ganze Zeit auch gedacht, als ich mich heute eingehender mit der Materie des WDF*P*IDF befasst habe.

    Karl sagt ja selbst, dass man diesen Wert nur als einen von vielen Rankingkriterien betrachten soll, wieso nehme ich zur Berechnung des Wertes dann Seiten heran, die auch aus ~200 anderen Gründen dort positioniert sein könnten?

    Ich finde der Wert an sich ist mit Vorsicht zu genießen, vorallem dann, wen man sich nicht auch andere Werte der Top10 positionierten genaustens anschaut, oder deren Texte auch mal wirklich liest. Wir kennen doch alle die Seiten in den Top10, bei denen es sehr fragwürdig ist, wieso diese überhaupt dort ranken. Oft ist die Antwort relativ simpel: Die gute, alte Linkkeule wurde kräftig geschwungen. Möchte ich eine solche Seite wirklich in einen Wert mit einbeziehen, der mir nacher eine grobe Richtlinie dafür gibt, wie ich meinen Text schreiben sollte? Eher nicht...

    Die Idee dahinter, Texte zu schreiben, die sich eingehend mit einer Thematik befassen und Keywords besitzen, die das klare Signal senden "hier gehts um XYZ" ist aber um weiten besser, als seine Texte nur auf die Keyworddensity eines einzigen Keywords zu optimieren und dabei außer acht zu lassen, dass zu "XYZ" eventuell auch noch "ABC" und "JKL" gehören.

  • [...] 10 Theorien für ein gutes Google-Ranking Es gibt wohl kaum eine Branche, die mit so vielen Mythen wie die SEO-Branche durchsetzt ist. Martin Mißfeldt hat sich mit 10 Theorien für ein gutes Ranking bei Google näher auseinandergesetzt. Passend dazu auch David Lindens ausführlicher Beitrag über die neue SEO Formel WDF*P*IDF. [...]

  • [...] wieder zum Trend werden, was unwahrscheinlich ist, ließe sich das übrigens nur schwer mit dem SEO Trend WDF*IDF vereinbaren, finde ich. Tags: Artikel, Bloggen, Blogger, Text, [...]

  • [...] Textoptimierung liest nicht, bzw. fast nicht. Also Finger Weg von Keyword Density oder neuerdings WDF*P*IDF Kram, denn naturgemäß kommen wichtige Keywords in kürzeren Texten deutlich häufiger vor als in [...]

  • [...] mal zu konkreteren SEO Hypes zu kommen möchte ich nur einmal auf WDF*IDF verweisen. Ich weiß nicht ob in der zweiten Hälfte des vergangenen Jahres irgendetwas in der SEO [...]

  • [...] da, in abgewandelter Form. Als ich mich mit der Sache beschäftigt habe, schoss mir sofort das Thema WDF*IDF in den Kopf, auch genannt die Termgewichtung, die im letzten Jahr für einen Hype in der SEO Szene gesorgt hat, [...]

  • [...] um welche Version der Term Frequency es sich handelt, also ob es sich um eine Entsprechung der WDF-IDF Formel handelt oder nicht. Vom Prinzip her läuft es jedenfalls darauf hinaus, dass Facebook die für den [...]

  • […] Dabei sind theoretische und strukturelle Modelle, Formen und Zahlen erst einmal egal, WDF*P*IDF “pimped” (Zitat) eben auch den langweiligsten Text nicht auf geil. Der Content ist das […]

  • […] als relevant zu einem Thema angesehen zu werden. Letztes Jahr gab es daher den großen Hype um WDF*IDF. Mit Tools die sich nach dieser Formel richten, kann man ermitteln, welche Wörter in einem Text […]

  • […] heraus. Diese Angst vor Formeln oder was auch immer, hat sich auch damals in der Diskussion um WDF*IDF gezeigt. Man konnte zwischendurch beinahe glauben, dass es sich um magisches Teufelszeug handelt, […]

  • […] content. Andererseits, entschuldigt die Ausdrucksweise, kacken die meisten bei Themen wie WDF*P*IDF mental voll ab. Ich gehe das Thema “EdgeRank” heute mal etwas anders an, als es sonst […]

  • […] Die Textoptimierung ist einer der wichtigsten Bestandteile der Onsite-Optimierung. Das Seosweet API analysiert die Keyword-Dichte Ihrer Texte, macht Vorschläge für die latent semantische Optimierung und prüft zudem andere OnSite-Faktoren, wie zum Beispiel die korrekte Auszeichnung von HTML-Elementen wie etwa Überschriften. Zusammengenommen sind das schon wichtige Informationen aus denen sich sinnvolle Rückschlüsse für die Textoptimierung ziehen lassen. Aber es gilt: Die Keyword-Dichte ist die rudimentärste Art der Textoptimierung und daher sollte kein Text nur nach ihr optimiert werden. […]

Leave a Reply

Rules of the Blog
Do not post violating content, tags like bold, italic and underline are allowed that means HTML can be used while commenting. Lorem ipsum dolor sit amet conceur half the time you know i know what.

Loading Facebook Comments ...

No Trackbacks.