Warum Sie Duplicate Content vermeiden sollten

Veröffentlicht am 25.08.2020 von DomainFactory

Duplicate Content stellt in der Regel keinen Abstrafungsgrund für Suchmaschinen dar und führt nur in den seltensten Fällen dazu, dass eine Seite von Google & Co nicht mehr indexiert wird. Trotzdem sollten Sie Duplicate Content möglichst vermeiden, denn gleiche oder sehr ähnliche Inhalte unter verschiedenen URLs können das Ranking (PageRank) negativ beeinflussen. Dieser Artikel erklärt warum und gibt Ihnen Tipps, wie Sie Duplicate Content vermeiden können.

Was ist Duplicate Content?

Google beschreibt Duplicate Content (doppelter Inhalt / duplizierter Inhalt) als „umfangreiche Inhaltsblöcke, die anderen Inhalten in derselben oder einer anderen Domain entsprechen oder auffällig ähneln“. Wichtig dabei: Duplizierte Inhalte kann es sowohl innerhalb einer Domain – etwa auf verschiedenen Subdomains (interner Duplicate Content) – oder auf unterschiedlichen Domains (externer Duplicate Content) geben.

Übersetzungen, Inhalte in Apps oder unterschiedliche Seiten mit gleichem Titel oder gleicher Description wertet Google nicht als Duplicate Content.

Ursachen für doppelten Content

Duplicate Content ist ein Teil der Internet-Normalität. Matt Cutts (Google) schätzt, dass 25 bis 30 % der Inhalte im weltweiten Netz Duplicate Content sind. Bestätigt wird diese Einschätzung durch die SEO-Tool-Plattform Raventools, die zwischen Februar 2013 und Juni 2015 mehr als 200 Millionen Page Crawls durch das Website-Diagnose-Tool „Website Auditor“ auswertete und dabei zu dem Ergebnis kam, dass 29 % der untersuchten Seiten duplizierte Inhalte hatten.

Nur selten stecken manipulative oder betrügerische Absichten hinter diesen duplizierten Inhalten. Und nur in diesen Fällen, wenn etwa das Ranking einer Seite durch doppelten Content manipuliert werden soll oder versucht wird, Seitenbesucher zu täuschen, behält sich Google vor, die entsprechende Seite in den Suchergebnissen herabzustufen oder ganz aus dem Google-Index zu entfernen.

Interner Duplicate Content entsteht unbeabsichtigt, wenn

gleiche Inhalte über mehrere URLs zu erreichen sind, z. B. beispieldomain.de, beispieldomain.de oder www.beispieldomain.de;
zu einer Seite auch eine druckoptimierte Version existiert;
identische Shopartikel über mehrere URLs angezeigt oder verlinkt werden;
Blogposts sowohl auf einer Hauptseite als auch im Blog publiziert werden.

Häufige Ursachen für externen Duplicate Content sind:

Inhalte, die auf anderen Seiten wiederveröffentlicht (syndiziert) oder im Rahmen von Content-Kooperationen auch auf anderen Seiten publiziert werden;
Pressemitteilungen oder News, die auf verschiedenen Seiten oder Presseportalen abrufbar sind;
Inhalte, die unrechtmäßig von einer Seite kopiert und unter anderen URLs veröffentlicht werden;
identische Seiten oder größere Inhaltsblöcke, die nach einem Domainumzug sowohl unter der neuen als auch der alten URL erreichbar sind;
identische, nicht übersetzte Inhalte auf länderspezifischen Seiten (z. B. http://beispieldomain.de und beispieldomain.es).

Wie beeinflusst Duplicate Content das Ranking?

Doppelter Content stellt Suchmaschinen vor die Herausforderung, zu entscheiden, welcher der Inhalte bei der Suche höher gerankt werden und welche URL ggf. sogar von der Suche ausgeschlossen werden soll. In vielen Fällen können Google-Algorithmen doppelte Inhalte automatisch richtig bewerten und ggf. entscheiden, ob böswillige Absicht dahintersteckt.

Nicht immer sind jedoch die Parameter für die Suchmaschinen eindeutig und führen zu den gewünschten Schlüssen. Die Gründe dafür sind vielfältig – nur ein Beispiel: Ein wichtiger Parameter für ein „Original“ ist das Datum der ersten Indexierung. Wurde jedoch ein Inhalt zuerst auf einer Website publiziert, die von Google Bot eher selten besucht wird (z. B. weil sie noch recht jung und extern noch nicht gut verlinkt ist), kann es sein, dass dieser Inhalt auf einer zweiten Seite, die ihn übernommen hat und vom Bot häufiger gecrawlt wird, früher indexiert wird. Die Quellseite geht dann beim Ranking leer aus.

Doppelte Inhalte, insbesondere auch interner Duplicate Content, sind zudem nicht nur für Suchmaschinen eine Herausforderung, sondern auch für externe Sites, die auf Inhalte der eigenen Seite verlinken (Inbound Links). Kommen diese Inhalte auf der eigenen Website mehrfach vor, werden sich die Inbound Links wahrscheinlich über alle Quellen verteilen, anstatt sich auf eine URL zu konzentrieren. Da eingehende Links ein Ranking-Faktor sind, kann sich das negativ auf die Suchergebnisse auswirken.

Doppelte Inhalte finden

Der direkteste Weg zum Aufspüren von Duplicate Content ist die manuelle Suchanfrage. Geben Sie dazu eine markante Textstelle (nicht mehr als zwei bis drei Sätze) der Seite, die sie überprüfen möchten, in eine Suchmaschine ein.

Darüber hinaus gibt es eine Reihe von Tools, die beim Auffinden von doppelten Inhalten nützlich sind. So lässt sich z. B. mit CopyScape externer Duplicate Content durch eine einfache Eingabe der URL der zu prüfenden Seite finden. Interne doppelte Inhalte spüren Sie in ähnlicher Weise mithilfe von Siteliner auf. Die Google Search Console warnt Webmaster, wenn Google Hinweise auf doppelte Inhalte bei einer Website hat. Das Webtool Screaming Frog ermöglicht darüber hinaus auch die gezielte Suche nach Duplikaten bei Seitennamen, Überschriften, Meta-Descriptions, URLs etc.

Internen Duplicate Content beheben und vermeiden

Falls identische Inhalte (Textblöcke oder ganze Seiten) Ihrer Website unter mehreren URLs publiziert sind, gibt es vor allem zwei Wege, doppelten Content zu beheben oder von vornherein zu vermeiden: entweder Dopplungen reduzieren oder den Suchmaschinen mitteilen, welcher der Inhalte das gewünschte „Original“ ist.

Nutzen Sie 301-Weiterleitungen, wenn die Inhalte unter mehreren URLs (z. B. beispieldomain.de oder www.beispieldomain.de) erreichbar sein sollen. Wie Sie 301-Redirects mit einer .htaccess-Datei einrichten, erfahren Sie in diesem Beitrag.
Verwenden Sie immer dieselben internen Verlinkungen und vermeiden Sie Linkvariationen, bei denen z. B. einmal auf http://beispielseite.de/details und ein anderes Mal auf http://beispielseite.de/details/index.htm verwiesen wird.
Fassen Sie Seiten mit ähnlichen Inhalten und identischen Textblöcken zu einer Seite zusammen.
Definieren Sie das Original oder die bevorzugte Seite über Canonical-Tags im HTML-Header der duplizierten Seiten. Folgende Zeile im Header verweist dabei auf die Originalseite (hier: beispielseite.de/details):

<link rel=“canonical“ href=“https://beispielseite.de/details“/>
Vermeiden Sie wenn möglich wiederkehrende Textbausteine. Statt z. B. identische Textblöcke auf den Produktseiten ähnlicher Produkte zu wiederholen, richten Sie eine Detailseite mit entsprechenden Informationen ein, auf die Sie verlinken.
Sorgen Sie dafür, dass jede Website, auf der Ihr Content syndiziert (wiederveröffentlicht) wird, eine Rückverlinkung zum Original enthält. Alternativ können die syndizierenden Seiten auch mit einem noindex-Meta-Tag im HTML-header von den Google-Suchergebnissen ausgeschlossen werden:

<meta name="robots" content="noindex"> oder

<meta name="googlebot" content="noindex">
(schließt nur Google Web-Crawler aus der Indexierung aus).

Ihr WordPress-Hosting-Powerpaket - Blitzschnell, sicher und flexibel

Unser WordPress-Hosting bietet Ihnen Top-Performance, umfassende Security-Features und optionale Staging-Umgebungen. Perfekt für Ihre Website oder Ihren…

Starten Sie jetzt

Der Autor:

DomainFactory

http://www.df.eu

Als Qualitätsanbieter überzeugen wir mit HighEnd-Technologie und umfassenden Serviceleistungen. Mit mehr als 1,3 Millionen verwalteten Domainnamen gehören wir zu den größten Webhosting-Unternehmen im deutschsprachigen Raum.

Weitere Artikel von diesem Autor