Mai
17
2011

rel canonical bei doppelten Inhalten

Der link rel=”canonical” – den duplicate content in den Griff bekommen

Über das Thema duplicate content, also Web-Inhalte die (nahezu) identisch sind wurde schon viel geschrieben. Das hierzu der meta-tag „link rel=”canonical” eingeführt wurde ist auch nicht neu. Allerdings hat Google (Matt Cutts) nun ein bisschen was an zusätzlichen Informationen zu diesem Thema veröffentlicht.

Hierzu eine kurze Zusammenfassung:

  • Google sieht den meta-tag rel=canonical eher als einen Hinweis und folgt diesem in der Regel auch
  • Ausnahmen gibt es dabei schon, wenn Google der Meinung ist, der Einsatz des tags wäre ein Fehler oder es würde der eigentlichen Seite eher schaden

Beispiele:

  • Der meta-tag verweist auf eine URL, die es gar nicht gibt und dadurch eine 404-Meldung vom (Ziel-) Server ausgegeben wird.
  • Google ist der Meinung, die Website ist gehackt und der rel=canonical wurde vom Hacker eingefügt
  • Der tag rel=canonical sitzt nicht an seinem passenden Platz im Quellcode.

Richtig wäre, ihn innerhalb des Headers zu platzieren, wobei es ganz wichtig ist, dass der Beginn und das Ende des „head“-Bereichs eindeutig erkennbar sind – der rel=canonical tag also zwischen <head> und </head> eingefügt ist. Idealerweise findet sich der meta-tag möglichst weit am Anfang des Headers. Dadurch erhöht sich die Wahrscheinlichkeit, dass der Crawler ihn auch wirklich annimmt.

Um nun auch sicher zu gehen, dass die Seite mit dem doppelten Inhalt nicht für den Googleindex verwendet wird, könnte man nun meinen, es wäre sinnvoll der jeweiligen Seite zusätzliche meta tags mitzugeben, um den Crawler tatsächlich davon abzuhalten, die Seite einzulesen – dem ist aber (laut Google) nicht so. Ergo sollten auf der jeweiligen Seite meta tags wie „<meta name=”robots” content=”noindex, nofollow”>“ nicht zusätzlich zum rel=canonical verwendet werden. Auch ein „Disallow“ in der robots.txt ist nicht sinnvoll. Der Crawler möchte hier nämlich nicht ausgeschlossen (ausgesperrt) werden, sondern die Seite analysieren und diese als doppelten Inhalt mit dem Hinweis auf das „Original“ erkennen.

rel=canonical oder 301-Weiterleitung?

In manchen Fällen könnte es schwierig werden einer URL, die sich geändert hat (z.B. durch einen Relaunch) eine 301-Weiterleitung mitzugeben. Der rel=canonical tag ist dann aber nur eine echte Notlösung, um zu signalisieren: „Hallo, geh doch bitte zu dieser neuen URL!“ Normalerweise sollte es relativ problemlos möglich sein, jeweils eine 301-Weiterleitung zur Nachfolge-URL einzurichten – und dies sollte auf jeden Fall bevorzugt werden, da die 301-Weiterleitung eine eindeutige Definition (auch für andere Suchmaschinen) darstellt: „Hallo Bot, diese URL gibt es gar nicht mehr, geh doch direkt zur neuen URL!“

In der Praxis – doppelter Inhalt für den User und rel=canonical für den Crawler

Doppelte Inhalte können sehr leicht entstehen und auch sehr sinnvoll sein – müssen dann aber mit dem tag rel=canonical versehen auf das eigentliche Original verweisen. Beispielsweise können Produktseiten in mehreren Kategorien einer Website auftauchen oder sogar siteübergreifend auf weiteren Domains notwendigerweise eingebunden sein. So sieht der User die gewünschte Produktinformation ohne dabei auf die eigentliche (Original-) Seite auf einer anderen Domain geleitet zu werden. Der User bleibt also innerhalb der Domain, in der er gestartet ist. Der Crawler allerdings würde die doppelten Inhalte am tag rel=canonical erkennen und die Gewichtung der Originalseite zuweisen.

Wie gut sind doch mittlerweile die (Online-) Zeiten – ist doch gar nicht so lange her, da ist man an diesen Problemen noch fast verzweifelt – rel=canonical, like it ;-) ).

Weitere Infos zum rel=canonical:

http://www.google.com/support/webmasters/bin/answer.py?answer=139394

http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

http://googlewebmastercentral.blogspot.com/2009/12/handling-legitimate-cross-domain.html

 



Share

Über den Autor: Horst Christian Wagner

Kommentar hinterlassen

Zieltraffic auf Facebook