Das Internet ist voll von Informationen. Wollen wir als Webseiten-Betreiber einzigartige Inhalte bereitstellen, ist das letztendlich gar nicht so leicht. Da hilft es durchaus, Googles Bewertungssystem von Duplicate Content zu kennen.
Die Definition von Duplicate Content
Ein Duplikat ist definitionsgemäss die zweite Ausfertigung eines Dokuments. Original und besagte Dopplung sind dabei absolut identisch.
Sobald es um Content, also Inhalte im World Wide Web, geht, wird die ganze Sache jedoch etwas komplizierter. Beachten wir einmal die gewaltige Anzahl existierender Webseiten, wird es da gar nicht mehr so leicht, ein Original von einem Duplikat zu unterscheiden. Und während die Webseite an sich “Unique”, also einzigartig, bleibt, kann es sich beim darauf veröffentlichten Inhalt gleichzeitig um Duplicate Content handeln.
Die Worte sind entscheidend
Nehmen wir also mal an, zwei verschiedene Webseiten veröffentlichen einen Text mit demselben Thema. Der Titel, einzelne Überschriften oder genutzte Keywords können dabei absolut identisch sein – was der thematischen Behandlung zu verdanken ist. Wie wird der Content Unique, statt als Duplikat zu zählen?
Die Antwort liegt in den Worten selbst und nicht, wie vielleicht vermutet, in deren Bedeutung. Ein Synonym verleiht einem Wort keine andere Bedeutung, es ändert einfach bloss den Ausdruck.
Google mag keinen Duplicate Content
Wir übrigens auch nicht. Davon abgesehen setzt Suchmaschinen-Riese Google viel daran, duplizierte Inhalte im Web zu erkennen. Und was ist die Folge, sofern Google einen Inhalt als Kopie erkennt? Nicht zwangsläufig, dass das Ranking besagten Inhalts schlechter ist. Stattdessen kommt es darauf an, wer Content-Urheber ist.
Veröffentlicht eine Webseite mehrfach Duplicate Content auf denselben Seiten, fasst Google gleichartige Inhalte kurzerhand zusammen. Das Resultat ist, dass in so einem Fall eine abgespeckte Auswahl des Contents in den Suchergebnissen erscheint. Google will damit verhindern, dass User Ergebnisse sehen, die sich zu stark ähneln und wie Wiederholungen daherkommen.
Googles Signale für Duplicate Content
Wie weiter oben angedeutet, setzt Google für die Erkennung von Duplicate Content nicht auf die Bedeutung, sondern auf die genutzten Worte. Blog-Betreiber beispielsweise, die sich gerne Inhalte von der Konkurrenz abgucken, sind also weitgehend sicher, sofern sie Texte geschickt umformulieren.
Google Webmaster Gary Illyes verriet in einem Podcast einiges darüber, welche Signale die Suchmaschine sonst noch so nutzt, um Duplicate von Unique Content zu unterscheiden. Insgesamt handelt es sich dabei um zwanzig unterschiedliche Attribute.
- Erkennung von Boilerplate Content (gleichbleibende Textblöcke wie etwa redaktionelle Anmerkungen oder Footer-Texte)
- PageRank der analysierten Seite
- Darstellung innerhalb der Sitemap
- gesetzte Weiterleitungen
- Canoncial-Links
- Verwendung von HTTPS
Dies sind nur einige Beispiele der Signale, welche bei Google Anwendung finden. Ausserdem besitzt jedes Signal eine entsprechende Gewichtung. Ausschlaggebend bleibt die Wort-Analyse, während alle anderen Attribute eher weitere Indizien darstellen.