Duplicate Content vermeiden: Umleitungen durch .htaccess
Veröffentlicht am 26.02.2016 von Benedikt Sahlmüller
Webseitenbetreiber möchten im Regelfall eins: Möglichst gut auf Google gefunden werden. Es gibt viele Faktoren, die ausschlaggebend sind dafür, wie gut eine Webseite gefunden wird. Einige davon kann man sogar sehr schnell beeinflussen: Beispielsweise macht es Sinn, die Webseitenperformance zu optimieren, oder man stattet den Domainnamen mit einem SSL-Zertifikat aus. Ein weitere Methode, die im nachfolgenden Text betrachtet wird, besteht darin, doppelte Inhalte – sogenannten „Duplicate Content" – zu vermeiden.Was ist Duplicate Content und warum ist er problematisch?
Einfach gesagt lesen Suchmaschinen den Inhalt einer Webseite und speichern Informationen darüber, welche Inhalte für welche Suchanfragen relevant sind.
Ziel bei der Suchmaschinenoptimierung (SEO) ist es, der Suchmaschine den Job so einfach wie möglich zu machen. Dazu zählt unter anderem, dass Sie dem Suchmaschinen-Bot eindeutige Domainnamen zu Ihren Inhalten liefern. Ist der gleiche Inhalt unter verschiedenen Domains erreichbar, bekommt die Suchmaschine keine eindeutigen Daten darüber, welche der Domains für den Inhalt relevant ist. Das Resultat – der sogenannte Duplicate Content – kann negative Auswirkungen auf den Pagerank haben oder sogar zur Abstrafung der Seite führen.
Eine Umleitung per .htaccess bauen – warum?
Die .htaccess-Datei eignet sich wunderbar für eine ganze Reihe von Dingen, zum Beispiel für Umleitungen zur Vermeidung von Duplicate Content.
Warum umleiten? Nun, wurde Ihr Webdokument mehrfach unter verschiedenen Adressen gespeichert, schwächt das in den Augen der Suchmaschine seine Relevanz. Um nun alle Zugriffe zu dem Dokument auf eine Domain zu lenken, benötigen Sie einen Nachsendeservice: Alle URL-Varianten, die bisher für den Aufruf der Seite möglich waren, werden künftig auf die eine, korrekte Adresse umgeleitet.
Der Clou dabei: Google bekommt zusätzlich die Information, dass die Adressänderung permanent ist.
Genau das macht die 301er-Umleitung: Sie meldet dem Server, wo das Suchergebnis ab sofort zu finden ist. Die neue Adresse kann von der Suchmaschine erlernt werden, sodass Ihr Inhalt künftig nur noch unter der gewünschten Domain auffindbar ist.
Nachfolgend finden Sie Fallbeispiele zur Einrichtung dieser Umleitungen.
Ursachen und Lösungen für Duplicate Content
Eine mögliche Ursache für Duplicate Content sind Webseiten, die unter ähnlichen, aber nicht gleichen Domainnamen aufrufbar sind. Wenn man Domains Zeichen für Zeichen betrachtet, sieht man schnell, was den Unterschied macht:
Beispiel 1
www.example.com
ist auch erreichbar unter
example.com
Der gleiche Inhalt ist nun mit und ohne www. erreichbar. Der Unterschied sieht zwar unscheinbar aus, aber Google könnte die Seite tatsächlich dafür abstrafen. Eine Lösung für dieses Problem bietet der folgende Code:
# Erzwinge www
RewriteEngine On
RewriteCond %{HTTP_HOST} !www\.example\.de$
RewriteRule ^(.*)$ www.example.de/$1 [L,R=301,QSA]
In der ersten Zeile des Codes wird geprüft, ob der Aufruf der Adresse mit www. erfolgt. Wurde die Domain nicht mit führendem www. eingegeben (!www\.), erfolgt die Umleitung auf www.example.de.
Beispiel 2
ist auch erreichbar unter
Die SSL Verschlüsselung – also der Aufruf der Seite über https – wird sehr empfohlen. Jedoch liegen auch hier zwei Wege vor, die Seite zu erreichen. Leiten Sie also um:
# Alle Aufrufe gehen auf SSL
RewriteEngine On
RewriteCond %{HTTPS} !on
RewriteRule (.*) %{HTTP_HOST}%{REQUEST_URI} [L,R=301]
Man muss davon ausgehen, dass die meisten Besucher einer Webseite deren Adresse ohne https eingeben. In einem solchen Fall (https !on) wird per 301-Umleitung auf die https-Version der Webadresse umgestellt.
Beispiel 3
www.example.com/hello
ist auch erreichbar unter
www.example.com/hello/
Den Unterschied könnte man beinahe übersehen: Ein Schrägstrich, der sogenannte "Trailing Slash“, folgt dem Aufruf und schon kann es sein, dass Google Ihren Beitrag doppelt indiziert. Diese Umleitung sorgt für "Trailing Slashes" an allen Domainnamen:
# Alle Domains haben trailing slashes
RewriteEngine On
RewriteCond %{REQUEST_URI} /+[^\.]+$
RewriteRule ^(.+[^/])$ %{REQUEST_URI}/ [R=301,L]
Mit dieser Regel kann der aufgerufenen Zeichenkette ein Slash-Zeichen (/) am Ende angestellt werden. Die 301-Umleitung erfolgt immer dann, wenn dem Schrägstrich am Ende der aufgerufenen Adresse noch weitere Zeichen folgen.
Um die oben genannten Weiterleitungen zu testen, übernehmen Sie diese einfach in Ihre .htaccess-Datei. Ist noch keine .htaccess-Datei vorhanden, kann sie per FTP im Stammverzeichnis des Domainnamens hinterlegt werden. Bitte ersetzen Sie den Beispiel-Domainnamen "example.com" gegen Ihren Domainnamen. Nutzen Sie ein CMS, informieren Sie sich vorher bitte, an welcher Stelle der Code eingetragen werden muss.
Tipps
[actioncard] 💡 Testen Sie die Aufrufe:
Prüfen Sie alle möglichen Optionen des Webseitenaufrufs selbst. So stellen Sie sicher, dass Ihre Webseite immer so dargestellt wird, wie Sie es möchten.
💡 Weitertesten
Browser-Plug-Ins wie „Redirect Plath“ (Chrome) helfen, den Status der Umleitung zu testen.
💡 Webmaster Tools
Viele wichtige Faktoren für das Ranking Ihrer Webseite finden Sie in den Google Webmaster Tools. Hier können Sie mitbestimmen, wie Google Ihre Webseite indexiert.
💡 Caching-Tools
Bitte beachten Sie: Durch Browser-Caching, aber auch durch Caching-Werkzeuge z.B. für WordPress, wird Ihnen Ihre Webseite möglicherweise anders dargestellt als Ihren Besuchern. Leeren Sie Ihren Cache daher, bevor Sie den Aufruf Ihrer Webseite prüfen.
💡 Zahl der Weiterleitungen eingrenzen
Zu viele aufeinanderfolgende Weiterleitungen können für den Google-Bot ein Problem darstellen. Eine Kette von Weiterleitungen sollte daher maximal 3 aneinander geknüpfte Glieder haben. Weitere Informationen hierzu, gibt es auf dem Google Webmaster-Blog.
💡 Interne Links aktualisieren
Definieren Sie auch innerhalb Ihrer Webseite die richtige Domain. Prüfen Sie dazu, dass bei allen internen Verknüpfungen (z.B. "Zurück zur Startseite") die korrekte Domain hinterlegt ist. Bei CMS, wie WordPress, muss die Blog URL angepasst werden.
💡 Kanonische URL
Nach der Umstellung auf die neue Domain sollten Sie ein sogenanntes "Canonical Tag"setzen. Das Canonical Tag liefert dem Suchmaschinenbot weitere Daten darüber, welche Adresse zukünftig die richtige für das Dokument ist. Nachfolgend ein Beispiel für ein solches Canonical Tag:
<link rel="canonical" href="https://www.example.com/"/>
Eingesetzt wird der Code in das Head-Element der Webseite.
Die oben benutzten Weiterleitungen und viele weitere .htaccess-Codes finden Sie hier:
[/actioncard]
Kommentare
Pascal
am 10.03.2020Meine sehr alte HTML -Startseite verfügt gemäss Google Search Console über "Duplicate Content" . Sie ist über die URL sowie aber auch über die "Indexseite" erreichbar. (Keine Weiterleitung) Gemäss [...] Meine sehr alte HTML -Startseite verfügt gemäss Google Search Console über "Duplicate Content" . Sie ist über die URL sowie aber auch über die "Indexseite" erreichbar. (Keine Weiterleitung) Gemäss Google als "nicht kanonisch" festgelegt. Also ist eine 301-Weiterleitung mit htaccsses vorgesehen. Doch nach dem Upload ist die Startseite nicht erreichbar und es erscheint die bekannte Fehlermeldung: " Umleitungsfehler: Die aufgerufene Website leitet die Anfrage so um, dass sie nie beendet werden kann."
Mit diesem Problem sind offenbar viele User konfrontiert wie ich aus diversen Foren ersehe.
Natürlich habe ich (fast) alle bisher gutgemeinten Ratschläge befolgt. "Cookies löschen usw.usw." Nützt jedoch alles nichts. Also..... htaccsses wieder löschen. Die Seite ist gottseidank wieder da, aber natürlich immer noch mit "Duplicate Content".
Nächster Schritt: CANONICAL" ! Sauberer Canonical Tag erstellt und Upload wie üblich. Und ja, er ist im Header aufgeführt. Die Startseite ist diesmal nicht verschwunden und auch keine Fehlermeldung. Die Freude ist gross, doch die Seite ist nach wie vor unter der URL wie auch unter der Intex-Seite erreichbar. Wo liegt der Wurm begraben? Benötigt ein gesetzter "Canonical" einige Tage bis dieser greift, bzw. von Google indexiert wird, oder bleibt die Seite weiterhin im "Doppel" erreichbar ?
Alexander Riegler
am 28.01.2019Ein kleiner Tippfehler: Redirect Plath > Path
Für Ungeübte wie mich, hätte noch der Hinweis stehen können, wie Tipp 1 und 2 kombiniert werden können. Von der Logik her war es aber klar, zuerst www [...] Ein kleiner Tippfehler: Redirect Plath > Path
Für Ungeübte wie mich, hätte noch der Hinweis stehen können, wie Tipp 1 und 2 kombiniert werden können. Von der Logik her war es aber klar, zuerst www dann https.
Danke für den Hinweis.
Alex
S. Maier
am 21.11.2018Vielen Dank für die ausführliche Beschreibung. Ich habe jedoch ein anderes Problem, welches oben leider nicht geschildert wurde.
Ich habe zwei Domains die auf ein Root-Verzeichnis zeigen - eine .de- [...] Vielen Dank für die ausführliche Beschreibung. Ich habe jedoch ein anderes Problem, welches oben leider nicht geschildert wurde.
Ich habe zwei Domains die auf ein Root-Verzeichnis zeigen - eine .de- und eine .at-Domain. Jetzt möchte ich beide Domains so weitergeleitet haben das sie mit https:// und www. angezeigt werden.
also wie folgt:
https://www.meineWebseite.de
https://www.meineWebseite.at
Ist das Möglich?
Ich habe versucht folgenden Code einzupflegen, was leider mit keinen Erfolg verbunden ist.
RewriteEngine On
RewriteCond %{HTTP_HOST} !www\.meineWebseite\.de$
RewriteRule ^(.*)$ http://www.meineWebseite.de/$1 [L,R=301,QSA]
RewriteCond %{HTTP_HOST} !www\.meineWebseite\.at$
RewriteRule ^(.*)$ http://www.meineWebseite.at/$1 [L,R=301,QSA]
RewriteCond %{HTTPS} !on
RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
Besten Dank im Voraus
Herzliche Grüße
Steve
Timo
am 02.06.2017Hallo Benedikt,
danke für die Übersicht.
Ich bin noch recht unerfahren was die htaccess Datei angeht. Ich kenne zwar das Grundlegende, aber im Detail muss ich mich nun auch mal damit beschäftigen [...] Hallo Benedikt,
danke für die Übersicht.
Ich bin noch recht unerfahren was die htaccess Datei angeht. Ich kenne zwar das Grundlegende, aber im Detail muss ich mich nun auch mal damit beschäftigen :-)
Du hast oben ja die drei Beispiele für https, www und / angegeben. Die funktionieren auch gut, danke.
Habe damit eine alte Regel ersetzt die komischer Weise nicht immer www erzwungen hat.
Ich habe in der .htaccess ja nun mehrere Anweisungen, die alle mit RewriteEngine On beginnen. Auch für eine Zugriffssperre auf den Include Ordner von Wordpress zum Beispiel. Ist es Sinnvoll diese alle zusammenzufassen um so jedesmal der RewriteEngine On Befehl zu sparen oder ist das egal? Übersichtlicher ist es natürlich wenn ich alles einzeln lasse. Spielt das aus Performance-Gründen eine Rolle?
Gruß Timo
Thomas
am 26.06.2016Ich frage mich, wie man es genau anders herum machen kann. Also von https auf http zwingen - und dabei das www erzwingen. Am Anfang soll immer "http://www." stehen. Geht das? Auch wenn jemand htt [...] Ich frage mich, wie man es genau anders herum machen kann. Also von https auf http zwingen - und dabei das www erzwingen. Am Anfang soll immer "http://www." stehen. Geht das? Auch wenn jemand https://domain.de eingibt?
Amal
am 19.06.2016Top, auch der Link zur Weiterempfehlung ist pures Gold wert. Danke!
<a href="http://hopes.website" rel="nofollow">hopes.website</a> Gucken kostet nichts ;-) Top, auch der Link zur Weiterempfehlung ist pures Gold wert. Danke!
<a href="http://hopes.website" rel="nofollow">hopes.website</a> Gucken kostet nichts ;-)
Martin
am 25.04.2016Danke für die Anleitung. Ganz klar ist mir das noch nicht:
Angenommen, das Root-Verzeichnis meiner Web-Site lautet /meinroot und die Haupt-Domain (ohne www) ist: meinedomain.de
Über die [...] Danke für die Anleitung. Ganz klar ist mir das noch nicht:
Angenommen, das Root-Verzeichnis meiner Web-Site lautet /meinroot und die Haupt-Domain (ohne www) ist: meinedomain.de
Über die Servereinstellungen zeigt meinedomain.de auf die Inhalte in /meinroot
Um Dupicate Content zu vermeiden, soll ja der Aufruif www.meinedomain.de" target="_blank" rel="nofollow">www.meinedomain.de umgeleitet werden.
Brauche ich für die Umleitung von www.meinedomain.de" target="_blank" rel="nofollow">www.meinedomain.de mittels .htaccess (301-redirect) ein zusätzliches Verzeichnis (also ein Verzeichnis, das nur die .htaccess-Datei enthält - z.B. meinrootwww) um Aufrufe mit www auf das Verzeichnis /meinroot umzuleiten oder habe ich NUR ein Verzeichnis, in der die .htaccess-Datei abgelegt ist.
Danke :-)
Szelei zoltan
am 01.12.2015Gut gut Gut gut
Benedikt
am 02.12.2015Hallo und Danke!
Haben Sie die Umleitungen schon getestet und erste Erfahrungen damit gesammelt? Hallo und Danke!
Haben Sie die Umleitungen schon getestet und erste Erfahrungen damit gesammelt?
Ja, alles kapiert, Danke der Nachfrage. Jetzt muss sich dann im Laufe der Zeit zeigen, wie Google reagiert. In den Webmastertools habe ich jetzt nur noch die Hauptdomain mit www drinnen. Ja, alles kapiert, Danke der Nachfrage. Jetzt muss sich dann im Laufe der Zeit zeigen, wie Google reagiert. In den Webmastertools habe ich jetzt nur noch die Hauptdomain mit www drinnen.
Benedikt
am 03.12.2015Wunderbar, das freut mich!
Ja, die Möglichkeit in der "Search-Console" umstellen zu können, ist eine super Sache. Leider klappt das mit der Protokoll-Umstellung nach https noch nicht so. Durch die [...] Wunderbar, das freut mich!
Ja, die Möglichkeit in der "Search-Console" umstellen zu können, ist eine super Sache. Leider klappt das mit der Protokoll-Umstellung nach https noch nicht so. Durch die Einstellungen in der .htaccess wird das aber aufgezwungen - das reicht sicher vorerst.
<a href="https://support.google.com/webmasters/answer/44231" rel="nofollow">Search-Console Hilfe zu www.</a>
ossi2612
am 21.11.2015Wenn ich im RP 2 eine zweite Domain per Dateipfad auf die erste Hauptdomain lege, wie sieht Google das? Und kann Google nicht erkennen, dass z.B. bei Domainnamen mit Umlaut eine gleichlautende Domain [...] Wenn ich im RP 2 eine zweite Domain per Dateipfad auf die erste Hauptdomain lege, wie sieht Google das? Und kann Google nicht erkennen, dass z.B. bei Domainnamen mit Umlaut eine gleichlautende Domain ohne Umlaut existiert, oder für viele Websites mehrere Länder-/Regionaldomains vorhanden sind? Es ist ja nicht außergewöhnlich oder schwer verständlich, wenn eine Firma Müller mit Sitz in München und Österreich folgende Domains hätte: mueller.de - mueller.bayern - mueller.at und alle drei nochmal mit "ü".
Wollte ich 301-Umleitungen legen, dann müsste ich ja in diesem Beispiel 5 weitere Aufträge (für jede Domain) anlegen, in die jeweils eine htaccess lege, oder wie sollte das praktisch funktionieren?
Benedikt Sahlmüller
am 23.11.2015Danke für Ihren Beitrag ossi2612.
Die <a href="https://www.df.eu/forum/threads/78266?p=495021" rel="nofollow">Antwort von Rüdiger im Forum</a> zeigt sicher die beste Variante: Die verschiedenen [...] Danke für Ihren Beitrag ossi2612.
Die <a href="https://www.df.eu/forum/threads/78266?p=495021" rel="nofollow">Antwort von Rüdiger im Forum</a> zeigt sicher die beste Variante: Die verschiedenen Domains zeigen auf eine .htaccess-Datei – die liegt ihrerseits vielleicht in einem Ordner „Umleitungen“. Von hier aus wird dann per 301 auf die Haupt- oder Zieldomain weitergeleitet.
Vielen Dank für die Antwort.
OK, das habe ich verstanden. mueller.de und müller.de und mueller.com. So schalte ich alle zusammen und vermeide doppelten Content.
Und wie setze ich nun zweite [...] Vielen Dank für die Antwort.
OK, das habe ich verstanden. mueller.de und müller.de und mueller.com. So schalte ich alle zusammen und vermeide doppelten Content.
Und wie setze ich nun zweite Domainnamen ein, um die Hauptdomain zu seo-technisch zu stärken?
z.B. elektro-mueller.de und handy-mueller.de und fernseh-mueller.de?
Benedikt
am 23.11.2015Idealerweise liefert jede Domain spezifische Inhalte aus. So würde die „Handydomain“ eine Landingpage zeigen, die sich inhaltlich um das Thema Handy dreht. Wenn jetzt die „Handydomain“ die selben [...] Idealerweise liefert jede Domain spezifische Inhalte aus. So würde die „Handydomain“ eine Landingpage zeigen, die sich inhaltlich um das Thema Handy dreht. Wenn jetzt die „Handydomain“ die selben Inhalte liefert wie die „Elektrodomain“, ergeben sich die oben beschriebenen Nachteile. Man könnte nun eine spezielle Landingpage erstellen zum Thema Handy und im Fließtext auf die Hauptdomain verknüpfen. So würde die „Handydomain“ einmalige Inhalte liefern und könnte die Hauptdomain unterstützen.
Ja - vielen Dank - auch im Forum wurde diese Lösung bevorzugt. Dann wird dies der Weg sein. Wieder was gelernt, nochmals Danke! Ja - vielen Dank - auch im Forum wurde diese Lösung bevorzugt. Dann wird dies der Weg sein. Wieder was gelernt, nochmals Danke!
Sepp
am 18.11.2015Danke für das tolle SEO-Manual. Gerade die Tipps mit dem Rewrite bzgl. https sind top.
Grüße,
Sepp Danke für das tolle SEO-Manual. Gerade die Tipps mit dem Rewrite bzgl. https sind top.
Grüße,
Sepp
Benedikt Sahlmüller
am 18.11.2015Danke Sepp - freut mich, wenn Ihnen die Tipps was bringen! Danke Sepp - freut mich, wenn Ihnen die Tipps was bringen!