WDF*IDF Analyse

Die WDF*IDF Analyse ist ein Tool welches bei der Suchmaschinenoptimierung oft eingesetzt wird. Es berechnet die Relevanz des eigenen Content im Vergleich zu gut positionierten anderen Inhalten in der Suchmaschine. Damit kann analysiert werden, wie gut der eigene Content gegenüber der bereits eingerankten Inhalten performen könnte. Aber Achtung: Das ist ziemlich theoretisch!

Wofür steht WDF

Die Abkürzung WDF steht für „Within Document Frequency“ und berechnet die Anzahl Worte in einem Text. Diese Worte werden dann kategorisiert und nach Gewichtung eingestuft. Damit wird die Relevanz des Content berechnet.

Wofür steht IDF

Die Abkürzung IDF steht für „Inverse Document Frequency“. Dieser Wert wiederspiegelt die Gewichtung des Wortes im Kontext zur Suchmaschinenindexierung. 

Kombiniert man nun WDF und IDF, so erfährt man, welche Begriffe in erfolgreichen positionierten Seiten besonders oft verwendet werden. Dann ist es ein leichtes, diese Begriffe ebenfalls in den eigenen Themen zu integrieren um die Seite noch Relevanter zu gestalten.

Das bedeutet: Mit der Formel WDF*IDF lässt sich bestimmen, in welchem Verhältnis bestimmte Wörter innerhalb eines Textdokuments, Dokumentenkorpus oder einer Website im Verhältnis zu allen potentiell möglichen Dokumenten gewichtet werden. Diese Formel berücksichtigt demnach die Termfrequenz und kann für die OnPage Optimierung genutzt werden, um die Relevanz einer Website für Suchmaschinen zu erhöhen, ohne dass dabei die Keyword Density allein eine Rolle spielt. – Quelle: Ryte Wiki

Berechnung von WDF*IDF

Falls es für jemanden relevant ist, wie sich WDF*IDF genau berechnet, hier die genaue Berechnung von Ryte:

Für die Formel WDF*IDF wird die Häufigkeit eines Wortes (i) in einem Text (j) mit der Häufigkeit des gleichen Wortes in einem relevanten Dokumentenkorpus multipliziert. Daraus ergibt sich die Gewichtung w dieses Terms (i) im Dokument (j):

wi,j= WDFi,j* IDFi

Der Faktor WDF ist die Abkürzung für „within document frequency“. Hierbei wird bestimmt, wie relativ häufig ein Term (also ein Wort oder eine Kombination) innerhalb eines Dokumentes vorkommt. Er errechnet sich wie folgt:

WDFi= log2(Freqi,j+ 1) / log2(L)

Der Logarithmus verhindert, dass bei der Berechnung eine enorme Erhöhung des Hauptkeywords zu einem besseren Wert führt. Während die Keyword-Dichte lediglich die prozentuale Verteilung eines einzelnen Wortes in Bezug auf die Gesamtwortzahl eines Textes berechnet, bezieht die Within-Document-Frequency auch das Verhältnis aller im Text verwendeten Wörter mit ein.

Der Multiplikator IDF berechnet die „inverse document frequency“, die Dokumentenhäufigkeit. Dazu wird die Termfrequenz (t) ins Verhältnis zum relativen Vorkommen aller übrigen Worte eines Textes bzw. Dokumentes (D) oder einer Website gesetzt. Somit wird mit IDF ermittelt, wie relevant ein Text hinsichtlich eines bestimmten Keywords ist. Die Berechnung gestaltet sich folgendermaßen:

IDFt= log (1 + ND/ ft)

Mit der „Inverse Document Frequency“ wird dem Faktor WDF ein Korrektiv hinzugefügt. Die Berechnung der inversen Dokumentenhäufigkeit ist wichtig, um die Häufigkeit an Dokumenten zu einem bestimmten Term mit einzubeziehen. IDF setzt die Anzahl aller bekannten Dokumente ins Verhältnis zur Zahl der Texte, welche den Term enthalten. Der Logarithmus dient auch hier der „Stauchung“ der Ergebnisse.

Beide Formeln miteinander multipliziert ergeben die relative Termgewichtung eines Dokuments im Verhältnis zu allen potentiell möglichen Dokumenten, die das gleiche Keyword enthalten. Um ein nützliches Ergebnis zu erhalten, muss diese Formel für jedes sinntragende Wort innerhalb eines Textdokuments durchgeführt werden.

Je größer die Datenbasis ist, die für die Berechnung von WDF*IDF herangezogen wird, desto präziser sind die Ergebnisse. – Quelle: Ryte Wiki

WDF*IDF und SEO

 

Weitere Themen der SEO Serie 

Digital Marketing Services 400x516

Social Media

Verbreite den erstellten Content über Social Media

Jetzt Starten
Suchmaschinenoptimierung SEA 400x516

SEO Technik

Themen welche die Technik der Webseite tangieren

Jetzt Starten
Conversion Daten und Business KPIs von Google Ads 400x516

Reporting & Messung

Sinnvolles Messen der SEO Optimierungen

Jetzt Starten
Offertanfrage 400x516

User Signals

Verhaltensmuster der Besucher erkennen und diese optimieren

Jetzt Starten