Tipps & Tutorials

Duplicate Content vermeiden: Umleitungen durch .htaccess


Veröffentlicht am 26.02.2016 von Benedikt Sahlmüller

Webseitenbetreiber möchten im Regelfall eins: Möglichst gut auf Google gefunden werden. Es gibt viele Faktoren, die ausschlaggebend sind dafür, wie gut eine Webseite gefunden wird. Einige davon kann man sogar sehr schnell beeinflussen: Beispielsweise macht es Sinn, die Webseitenperformance zu optimieren, oder man stattet den Domainnamen mit einem SSL-Zertifikat aus. Ein weitere Methode, die im nachfolgenden Text betrachtet wird, besteht darin, doppelte Inhalte – sogenannten „Duplicate Content" – zu vermeiden.

Was ist Duplicate Content und warum ist er problematisch?

Duplicate ContentEinfach gesagt lesen Suchmaschinen den Inhalt einer Webseite und speichern Informationen darüber, welche Inhalte für welche Suchanfragen relevant sind.

Ziel bei der Suchmaschinenoptimierung (SEO) ist es, der Suchmaschine den Job so einfach wie möglich zu machen. Dazu zählt unter anderem, dass Sie dem Suchmaschinen-Bot eindeutige Domainnamen zu Ihren Inhalten liefern. Ist der gleiche Inhalt unter verschiedenen Domains erreichbar, bekommt die Suchmaschine keine eindeutigen Daten darüber, welche der Domains für den Inhalt relevant ist. Das Resultat – der sogenannte Duplicate Content – kann negative Auswirkungen auf den Pagerank haben oder sogar zur Abstrafung der Seite führen.

Eine Umleitung per .htaccess bauen – warum?

Die .htaccess-Datei eignet sich wunderbar für eine ganze Reihe von Dingen, zum Beispiel für Umleitungen zur Vermeidung von Duplicate Content.

Warum umleiten? Nun, wurde Ihr Webdokument mehrfach unter verschiedenen Adressen gespeichert, schwächt das in den Augen der Suchmaschine seine Relevanz. Um nun alle Zugriffe zu dem Dokument auf eine Domain zu lenken, benötigen Sie einen Nachsendeservice: Alle URL-Varianten, die bisher für den Aufruf der Seite möglich waren, werden künftig auf die eine, korrekte Adresse umgeleitet.

Der Clou dabei: Google bekommt zusätzlich die Information, dass die Adressänderung permanent ist.

Genau das macht die 301er-Umleitung: Sie meldet dem Server, wo das Suchergebnis ab sofort zu finden ist. Die neue Adresse kann von der Suchmaschine erlernt werden, sodass Ihr Inhalt künftig nur noch unter der gewünschten Domain auffindbar ist.

Nachfolgend finden Sie Fallbeispiele zur Einrichtung dieser Umleitungen.

Duplicate Content Rewrite

Ursachen und Lösungen für Duplicate Content

Eine mögliche Ursache für Duplicate Content sind Webseiten, die unter ähnlichen, aber nicht gleichen Domainnamen aufrufbar sind. Wenn man Domains Zeichen für Zeichen betrachtet, sieht man schnell, was den Unterschied macht:


Beispiel 1

www.example.com

ist auch erreichbar unter

example.com

Der gleiche Inhalt ist nun mit und ohne www. erreichbar. Der Unterschied sieht zwar unscheinbar aus, aber Google könnte die Seite tatsächlich dafür abstrafen. Eine Lösung für dieses Problem bietet der folgende Code:

# Erzwinge www

RewriteEngine On

RewriteCond %{HTTP_HOST} !www\.example\.de$

RewriteRule ^(.*)$ www.example.de/$1 [L,R=301,QSA]

 

 

In der ersten Zeile des Codes wird geprüft, ob der Aufruf der Adresse mit www. erfolgt. Wurde die Domain nicht mit führendem www. eingegeben (!www\.), erfolgt die Umleitung auf www.example.de.

 


Beispiel 2

www.example.com

 

ist auch erreichbar unter

 

www.example.com

Die SSL Verschlüsselung – also der Aufruf der Seite über https – wird sehr empfohlen. Jedoch liegen auch hier zwei Wege vor, die Seite zu erreichen. Leiten Sie also um:

# Alle Aufrufe gehen auf SSL

RewriteEngine On

RewriteCond %{HTTPS} !on

RewriteRule (.*) %{HTTP_HOST}%{REQUEST_URI} [L,R=301]

 

Man muss davon ausgehen, dass die meisten Besucher einer Webseite deren Adresse ohne https eingeben. In einem solchen Fall (https !on) wird per 301-Umleitung auf die https-Version der Webadresse umgestellt.


Beispiel 3

www.example.com/hello

ist auch erreichbar unter

www.example.com/hello/

Den Unterschied könnte man beinahe übersehen: Ein Schrägstrich, der sogenannte "Trailing Slash“, folgt dem Aufruf und schon kann es sein, dass Google Ihren Beitrag doppelt indiziert. Diese Umleitung sorgt für "Trailing Slashes" an allen Domainnamen:

# Alle Domains haben trailing slashes

RewriteEngine On

RewriteCond %{REQUEST_URI} /+[^\.]+$

RewriteRule ^(.+[^/])$ %{REQUEST_URI}/ [R=301,L]

Mit dieser Regel kann der aufgerufenen Zeichenkette ein Slash-Zeichen (/) am Ende angestellt werden. Die 301-Umleitung erfolgt immer dann, wenn dem Schrägstrich am Ende der aufgerufenen Adresse noch weitere Zeichen folgen.

Um die oben genannten Weiterleitungen zu testen, übernehmen Sie diese einfach in Ihre .htaccess-Datei. Ist noch keine .htaccess-Datei vorhanden, kann sie per FTP im Stammverzeichnis des Domainnamens hinterlegt werden. Bitte ersetzen Sie den Beispiel-Domainnamen "example.com" gegen Ihren Domainnamen. Nutzen Sie ein CMS, informieren Sie sich vorher bitte, an welcher Stelle der Code eingetragen werden muss.

Tipps

[actioncard] 💡 Testen Sie die Aufrufe:

Prüfen Sie alle möglichen Optionen des Webseitenaufrufs selbst. So stellen Sie sicher, dass Ihre Webseite immer so dargestellt wird, wie Sie es möchten.

💡 Weitertesten

Browser-Plug-Ins wie „Redirect Plath“ (Chrome) helfen, den Status der Umleitung zu testen.

💡 Webmaster Tools

Viele wichtige Faktoren für das Ranking Ihrer Webseite finden Sie in den Google Webmaster Tools. Hier können Sie mitbestimmen, wie Google Ihre Webseite indexiert.

Zu den Google Webmaster Tools

💡 Caching-Tools

Bitte beachten Sie: Durch Browser-Caching, aber auch durch Caching-Werkzeuge z.B. für WordPress, wird Ihnen Ihre Webseite möglicherweise anders dargestellt als Ihren Besuchern. Leeren Sie Ihren Cache daher, bevor Sie den Aufruf Ihrer Webseite prüfen.

💡 Zahl der Weiterleitungen eingrenzen

Zu viele aufeinanderfolgende Weiterleitungen können für den Google-Bot ein Problem darstellen. Eine Kette von Weiterleitungen sollte daher maximal 3 aneinander geknüpfte Glieder haben. Weitere Informationen hierzu, gibt es auf dem Google Webmaster-Blog.

💡 Interne Links aktualisieren

Definieren Sie auch innerhalb Ihrer Webseite die richtige Domain. Prüfen Sie dazu, dass bei allen internen Verknüpfungen (z.B. "Zurück zur Startseite") die korrekte Domain hinterlegt ist. Bei CMS, wie WordPress, muss die Blog URL angepasst werden.

💡 Kanonische URL

Nach der Umstellung auf die neue Domain sollten Sie ein sogenanntes "Canonical Tag"setzen. Das Canonical Tag liefert dem Suchmaschinenbot weitere Daten darüber, welche Adresse zukünftig die richtige für das Dokument ist. Nachfolgend ein Beispiel für ein solches Canonical Tag:

<link rel="canonical" href="https://www.example.com/"/>

Eingesetzt wird der Code in das Head-Element der Webseite.

Die oben benutzten Weiterleitungen und viele weitere .htaccess-Codes finden Sie hier:

Github

[/actioncard]

 

Der Autor:


Unseren Kunden steht Benedikt im Support seit 2014 bei Anliegen jeglicher Art gerne und meist hingabevoll gestikulierend zur Seite. Backt er nicht gerade Ciabatta oder kocht mit Freuden, findet man ihn in seiner Freizeit garantiert vorm Rechner bei seiner Lieblingsbeschäftigung: Webshops optimieren. Denn Online- und Suchmaschinenmarketing sind seine große Leidenschaft.