Das Internet ist voll von Informationen. Als Webseiten-Betreiber wirklich einzigartige Inhalte bereitzustellen, ist schwieriger als es klingt. Umso mehr lohnt es sich, Googles Umgang mit Duplicate Content zu verstehen.
Die Definition von Duplicate Content
Ein Duplikat ist definitionsgemäss die zweite Ausfertigung eines Dokuments — Original und Kopie identisch.
Geht es aber um Inhalte im Web, wird das schnell komplizierter. Bei Milliarden von Seiten lässt sich ein Original kaum noch zuverlässig von einem Duplikat trennen. Und während die Webseite selbst einzigartig bleibt, kann der darauf veröffentlichte Inhalt gleichzeitig Duplicate Content sein.
Die Worte sind entscheidend
Angenommen, zwei Webseiten veröffentlichen einen Text zum selben Thema. Titel, Überschriften oder Keywords dürfen dabei identisch sein — das ist der Natur des Themas geschuldet. Was macht Content einzigartig statt doppelt?
Die Antwort steckt in den Wörtern selbst, nicht in deren Bedeutung. Ein Synonym ändert nicht, was gemeint ist — es ändert nur, wie es gesagt wird.
Google mag keinen Duplicate Content
Wir übrigens auch nicht. Google investiert jedenfalls erheblich darin, duplizierte Inhalte zu erkennen. Was passiert, wenn Google einen Inhalt als Kopie einstuft? Nicht zwangsläufig ein schlechteres Ranking — entscheidend ist, wer der ursprüngliche Urheber ist.
Veröffentlicht eine Webseite wiederholt Duplicate Content, fasst Google gleichartige Inhalte zusammen. In den Suchergebnissen erscheint dann nur eine reduzierte Auswahl. Google will verhindern, dass du als Nutzer Ergebnisse siehst, die sich zu stark ähneln.
Googles Signale für Duplicate Content
Wie erwähnt: Google bewertet Wörter, nicht Bedeutungen. Wer fremde Texte geschickt umformuliert, ist also weitgehend sicher.
Google Webmaster Gary Illyes hat in einem Podcast erläutert, welche weiteren Signale die Suchmaschine nutzt, um Duplicate von Unique Content zu unterscheiden. Insgesamt sind es zwanzig unterschiedliche Attribute.
- Erkennung von Boilerplate Content (gleichbleibende Textblöcke wie redaktionelle Anmerkungen oder Footer-Texte)
- PageRank der analysierten Seite
- Darstellung innerhalb der Sitemap
- Gesetzte Weiterleitungen
- Canonical-Links
- Verwendung von HTTPS
Das sind nur einige Beispiele. Jedes Signal hat eine eigene Gewichtung. Die Wort-Analyse bleibt ausschlaggebend — alle anderen Attribute liefern ergänzende Indizien.