Das Wichtigste in Kürze
- Duplicate Content ist Inhalt, der gleich ist und mehrfach im Internet verbreitet wird.
- Duplicate Content kann bewusst durch Kopieren von Inhalten, aber auch unbewusst durch technische Fehleinstellungen verursacht werden.
- Das Erstellen von einzigartigen Texten ist für gutes SEO unumgänglich!
Video by Timothy Scherman – Was ist Duplicate Content
Was ist Duplicate Content?
Duplicate Content ist Inhalt, der identisch und über mehrere URLs aufrufbar ist. Google möchte jedoch keine duplizierten, also doppelt oder mehrfach veröffentlichten Inhalte in seinem Index. Sobald ein Nutzer eine Suchanfrage startet, soll dieser nicht mehrmals den gleichen Inhalt zur Auswahl haben, sondern eine Vielfalt an Inhalten zu seiner Suche bekommen.
In der Vergangenheit war es eine große Herausforderung für Google, alle doppelten Inhalte zu finden, zu filtern und anschließend aus dem Index heraus zu ziehen.
Damit soll erreicht werden, dass dem Suchenden die bestmögliche Nutzererfahrung geboten wird. Das geht nur, wenn die Inhalte sich nicht wiederholen, sondern einzigartig sind. Falls andere Suchmaschinen, wie z.B. Bing oder Yahoo dies besser hinbekommen sollten als Google, würden die Menschen langfristig den Anbieter wechseln.
Wie kann es zu Duplicate Content kommen?
Duplicate Content entsteht manchmal bewusst durch Copy & Paste, also durch Kopieren von Inhalten – das sollte man daher tunlichst vermeiden. Es gibt aber auch Duplicate Content, der unbeabsichtigt entsteht, weil man sich mit der Technik von Websites nicht ausreichend auskennt. Um diese Fehler zu vermeiden, geben wir hier die ultimativen Tipps!
Duplicate Content durch verschiedene Parameterendungen
Duplicate Content kann entstehen, wenn auf einer Domian (im internen DC) mit Parameterendungen (z.B. durch Filteroptionen in einem Shop) gearbeitet wird. Sobald sich nur ein einziges Zeichen in der URL ändert, zählt dies für Google schon als komplett neue Domain.
Beispiel:
Falls sich im Shop der URL-Parameter für die Größe ändert, zählt Google dies als ganz neue Seite.
- https://www.mustershop.de/rote-schuhe/38
- https://www.mustershop.de/rote-schuhe/39
- https://www.mustershop.de/rote-schuhe/40
Vermieden werden kann dies mit dem sogenannten Canonical Tag. Dadurch wird sichergestellt, dass nur eine Seite in den Google Index gelangt.
Duplicate Content durch verschiedene Domainnamen
Das größte Problem im Bereich Duplicate Content sind die Domainnamen. Es gibt vier verschiedenen Möglichkeiten (http://, https://, http://www, https://www). Viele Leute vergessen, dass es diese vier Möglichkeiten gibt. Jede der vier Möglichkeiten zählt für Google als neue Domain. Jeder kann für seine eigene Webpräsenz zwar alle vier Möglichkeiten nutzen, sollte sich jedoch für nur eine URL entscheiden, die dann auf den Index bei Google gelangt – alle anderen URLs sollen dann auf die präferierte URL weitergeleitet werden. Es gibt dazu eine htacess-Datei, die im roots-Verzeichnis des Servers liegt. Dort kann man die Weiterleitungsregeln bestimmen. Ein guter Host-Service sollte dies allerdings automatisch machen.
Viele Website-Betreiber machen den Fehler, die drei anderen URLs nicht auf die Zieldomain weiterzuleiten. Für Google heißt das, dass die gleiche Website unter vier verschiedenen URLs auffindbar ist. Vermeide diesen Fehler unbedingt! Es wird wertvolle Rankingpower der URLs verschenkt – ohne Weiterleitung hat man nur ein Viertel der Power im Google-Ranking!
Beispiel für Domainnamen:
Falls Du externe Texter beauftragen möchtest, musst Du auf jeden Fall vorher Deine Wünsche in einem Briefing festhalten, damit Du auch einen Text bekommst, der einzigartig und passend ist. Danach müssen noch Bilder ausgewählt und gekauft werden, ein Titelbild muss gestaltet werden und das Ganze muss dann noch auf Deiner Website eingestellt werden.
If the URL parameter for the size changes in the shop, Google counts this as a completely new page.
- http://schild-roth.com
- http://www.schild-roth.com
- https://www.schild-roth.com
- https://schild-roth.com/ (nur diese Domain wird im Index aufgeführt) <<<<<<<
Tipps zur Einrichtung der Weiterleitung
Sobald ein Nutzer einen Server anfragt, wird von dort ein sogenannter Status-Code zurückgesendet. Den http-Status-Code kann man über den Status-Code-Checker überprüfen. Alle anderen Versionen müssen per 301-Weiterleitung (dauerhaft) weitergeleitet werden.
Duplicate content through blog ticker and transfer of media and product data
Another big problem that can cause duplicate content is in the area of blog tickers and media and product data. Actually, it seems to be simple: You simply take a news or blog ticker for your website from another site and install it on your own site. Or you can take over the product or media data from the manufacturer for the descriptions on your own page.
This saves effort and time – but leads to major problems for Google. The data (e.g. the manufacturer’s product descriptions) can then be found on hundreds or even thousands of websites. Always the same. So we have a massive duplicate content problem. Google will recognize all of these descriptions as duplicated and filter them out of the index. Your site will no longer be listed in the search. To avoid this, unique texts have to be written – and no text components have to be copied or copied anywhere. Google checks texts for the so-called „triplets“, these are combinations of three words each and see whether this triplet also exists in other texts. As soon as a certain percentage of identical triplet combinations is reached, Google evaluates the text as duplicated and no longer as unique. It can be assumed that Google will expand and change the system of the „triplet“ check several times in the future. Google will continue to refine its text checks to put really good and unique content high on the index.
We therefore strongly advise against using so-called „text spinners“ . These only automatically change the position of the sentence in existing texts and thus create numerous variants of the same text. That sounds effective and clever – but it can be assumed that Google will recognize the procedure and in the long term will also recognize the texts as duplicate content (DC).
Wie kann ich Duplicate Content vermeiden?
Grundsätzlich musst Du einzigartigen Inhalt erstellen, um Duplicate Content zu vermeiden. Was Du zusätzlich tun kannst, erfährst Du hier:
Tools zur kostenlosen Überprüfung auf Duplicate Content
Um sicherzustellen, dass Dein Content wirklich einzigartig ist, kannst Du Deine Texte (oder die Texte, die jemand für Dich schreibt) auf Plagiate prüfen lassen.
Hier gibt es folgende kostenlose Tools:
Small-SEO-Tools (Plagiatsprüfung)
Copy-Scape
Dupli-Checker
Grammarly
Textteile als Zitat bezeichnen
Manchmal kann es sinnvoll sein, Originaltexte oder Auszüge davon wiederzugeben. Dies kann auch für den Nutzer interessant sein. Damit diese Textpassagen nicht als Duplicate Content gewertet werden, gibt es zwei HTML-Befehle, die genutzt werden können:
<cite> </cite>
<blockquote> </blockquote>
Sobald Du diese HTML Befehle an den Anfang der zitierten Textpassagen stellst (und mit oder wieder beendest), wird Google die Texte als Zitate werten und nicht als Duplicate Content.
Einzigartige SEO-Texte schreiben lassen
Damit Deine Website einzigartige Inhalte hat und diese für den Nutzer und potenziellen Kunden die Beantwortung all seiner Fragen bieten kann, bleibt dir nichts anderes übrig, als einzigartigen Content (Inhalt) zu produzieren. Kopieren von Textpassagen von anderen Webseiten ist keine Option. Der Inhalt muss darüber hinaus zu Deinem Unternehmen und zu Deinem Angebot passen.
Falls Du externe Texter beauftragen möchtest, musst Du auf jeden Fall vorher Deine Wünsche in einem Briefing festhalten, damit Du auch einen Text bekommst, der einzigartig und passend ist. Danach müssen noch Bilder ausgewählt und gekauft, ein Titelbild gestaltet und das Ganze dann noch auf Deiner Website eingestellt werden.