Wciśnij enter, aby wyszukać, lub esc, aby zakończyć.

© HaywireMedia - Fotolia.com
Mateusz Mazurek w Pozycjonowanie

Duplicate content – co to jest i jak się przed tym ustrzec

Duplicate content, to inaczej zdublowana (powielona) treść. Jest to nieprzyjemne zjawisko, którego powodem najczęściej jest nieprawidłowa budowa serwisu internetowego internetowej.
Postaram się opisać dzisiaj najczęściej spotykane błędy związane z duplicate content, które mogą doprowadzić do usunięcia z indeksu wyszukiwarki „zduplikowanych” podstron. Podam też kilka sposobów, na radzenie sobie z duplicate content w ramach naszej strony www.

Najczęściej spotykane błędy powodujące duplicate content

Wiele „stron głównych”
Często spotykanym przeze mnie błędem jest dostępność strony głównej seriwsu pod kilkoma adresami URL.
Trzeba pamiętać, że poniżej podaje przykłady zupełnie różne adresy strony w oczach Google:
http://www.strona.pl/
http://strona.pl/
http://www.strona.pl/index.php
http://strona.pl/index.php
http://www.strona.pl/index.php?lang=pl

Paginacja na stronie i powtórzona pierwsza strona
Kolejnym często spotykanym błędem w budowie różnego rodzaju CMSów jest „powtórzenie” pierwszej strony na liście stron z wynikami (np. w kategorii sklepu, na stronie z listą ogłoszeń) posiadającymi podział na strony.

Na przykładzie Demotywatory.pl:

Demotywatory.pl - paginacja
Chcemy obejrzeć kolejną stronę z wynikami i trafiamy na /page/2
Demotywatory.pl - paginacja
Chcemy wrócić na stronę pierwszą i wracamy na /page/1 zamiast http://demotywatory.pl/.

Identyczna treść, jest więc dostępna pod adresem http://demotywatory.pl/ i http://demotywatory.pl/page/1 i jest to błąd.

„Przyjazne” i „nieprzyjazne” adresy URL
Jednym z błędów jest niekonsekwentne wprowadzenie adresów URL SEO frendly w wyniku czego dana podstrona może być dostępna pod przyjaznym adresem (np. /apple/iphone-4-32gb), jak i adresem z parametrami (np. /show.php?type=product&id=1234).

Warto mieć na uwadze tę kwestię i sprawdzić serwis pod kątem występowania linków do „nieprzyjaznych” adresów URL w serwisie internetowym lub pozostałości po wcześniejszym nazewnictwie adresów URL.

Linki afiliacyjne / parametry w adresie strony
Kolejną „pułapką” związaną z duplicate content jest stosowanie parametrów w adresach stron np. w ramach programu partnerskiego, czy oznaczając źródło ruchu z kampanii reklamowych.

Co ciekawe, Google nie potrafi automatycznie wykluczyć z indeksu linków zawierających parametry kampanii z Analytics (utm_medium, utm_source, utm_campaign etc.).

Trzeba mieć na uwadze, że ta sama strona ze swoim podstawowym adresem URL, jak i z dodatkowym parametrem np. /?polecam=maciek to jedno i to samo i należy uważać, aby w indeksie wyszukiwarki znajdowały się wyłącznie podstrony bez dodatkowych parametrów.

Treść powielana w serwisie
Powielanie tej samej treści na różnych podstronach serwisu, także powoduje duplicate content.
Oczywiście nie pisze tutaj o 1 czy 2 zdaniach umieszczonych na części podstron, ale o dłuższych fragmentach tekstu. Warto sprawdzić swój serwis internetowy pod tym kątem.

Jak się ustrzec przed duplicate content?

Jest kilka metod działania, które po wdrożeniu w ramach naszego serwisu internetowego pozwolą
Poniżej trzy metody walki z duplicate content – od najskuteczniejszej do tej najmniej przeze mnie polecanej.

  1. Przekierowanie 301
    Czyli przekierowanie zduplikowanej strony na jej właściwą, oryginalną wersję.
    Przekierowanie stałe (301) jest najlepszą metodą na wskazanie wyszukiwarce właściwego adresu. Dodatkowo przenosi ono całą „moc” przekierowywanej podstrony.
  2. Metatag rel=”canonical”
    … czyli wskazanie wyszukiwarce internetowej, pod jakim adresem znajduje się ta „właściwa” wersja strony / treści. (więcej).
  3. Wykluczenie z indeksacji
    Najmniej polecana metoda, czyli wykluczenie dajej podstrony z indeksacji za pomocą pliku robots.txt lub metatagu noindex.
    W tym wypadku informujemy robota wyszukiwarki, aby nie indeksował danej podstrony. Trzeba pamiętać, że zastosowanie wyłącznie wykluczenia z indeksacji danej podstrony nie uchroni nas przed „wyparowywaniem” jej mocy.

Opisałem tutaj co prawda wyłącznie kwestie związane z „wewnętrznym” duplicate content (w ramach jednej domeny), ale sprawa wygląda bardzo podobnie z kopiowaniem treści w ramach różnych stron internetowych (powielanie opisów produktów producenta, kopie strony pod różnymi domenami, udostępnianie artykułów do przedruku).

W telegraficznym skrócie:

Jedna treść powinna być dostępna wyłącznie pod jednym, unikalnym adresem URL!

Niestosowanie się do tej zasady może pociągnąć za sobą przykre konsekwencje w postaci wyindeksowania podstron na których nam zależy z indeksu wyszukiwarki, czy w skrajnym przypadku do nałożenia filtru na całą naszą domenę.

* zdjęcie do wpisu zapożyczone z SEOmoz.

Fot. © HaywireMedia - Fotolia.com
Komentarze

3 komentarze

shpyo

W przypadku linków afilacyjnych lepiej jest tworzyć je poprzez # np. sklep.pl/#partner=shpyo czy nawet sklep.pl/#partner/shpyo

Mateusz Mazurek
kulturystyka

Duplicat content może i jest zjawiskiem nie pożądanym jednak zawsze mnie zastanawiało czemu google nie kara, które opierają o artykuły kupione z agencji prasowych. Unikalna sensowna treść jest ok ale informacja ma to do siebie że jak jest ciekawa to jest powielana, cytowana itp. To normalne zjawisko także i w internecie stąd też zadbaj o odpowiednio wysoki TR swojego serwisu, a i Google zacznie bardziej łaskawie na niego spoglądać.


Skomentuj

Mateusz Mazurek

Pasjonat internetu zajmujący się pozycjonowaniem od 2004 roku, a od 2006 świadczący usługi SEO dla klientów. Żywo zainteresowany tematyką IT, biznes, e-commerce, usability, analityką internetową i pokrewnymi.