Upozornění vyhledávače na přednostní verzi dokumentu
Když spustíte web s daty nebo máte jiné důvody, proč by mohl být dokument duplikován, je důležité říci, že vyhledávače, které kopírují, jsou hlavní kopií nebo v žargonu "kánonická" kopie. Když vyhledávač indexuje vaše stránky, může zjistit, kdy byl obsah duplikován. Bez dalších informací vyhledávač rozhodne, která stránka nejlépe vyhovuje potřebám svých zákazníků. To může být v pořádku, ale existuje mnoho instancí vyhledávačů poskytujících staré a zastaralé stránky, protože si vybrali špatný dokument jako kanonický.
Jak určit kanonickou stránku
Je velmi snadné říct vyhledávačům kanonickou adresu URL s metadata ve vašich dokumentech. Vložte následující kód HTML v horní části prvku HEAD na každou stránku, která není kanonická:
Pokud máte přístup k hlavičkám HTTP (např. Pomocí .htaccess nebo PHP), můžete také nastavit kanonickou adresu URL na soubory, které nemají HTML HEAD jako PDF. Chcete-li to provést, nastavte záhlaví pro nekanonické stránky takto:
Odkaz: < URL kanonické stránky >; rel = "canonical"
Jak Canonical Tag funguje a kdy to není
Kanonická metadata se používá jako nápověda vyhledávačů, která stránka je hlavní. Vyhledávače to používají k aktualizaci svého indexu tak, aby odkazoval na hlavní kopii jako na primární kopii, a když doručují výsledky vyhledávání, přinášejí stránku, kterou považují za kanonickou.
Ale kanonická stránka, kterou zadáte, nemusí být stránka, kterou vyhledávače poskytují.
Existuje mnoho důvodů, proč se to může stát:
- Pokud zadaná adresa URL není 404 nalezena, vyhledávače se pokusí nalézt druhou nejrelevantnější adresu URL, která má být zobrazena
- Pokud se vyhledávač domnívá, že vaše stránky byly napadnuty a přidaly falešnou kanonickou adresu URL, nebudou to používat (samozřejmě budete mít v tomto případě větší problémy)
- Pokud umístíte odkaz do značky, nebo existuje důvod se domnívat, že značka HEAD nebyla uzavřena. Důvodem je to, že mnoho webových stránek umožňuje uživatelům upravovat obsah na stránce (uvnitř prvku BODY) a jako naléhavý kanonický odkaz, který by byl také nedůvěryhodný.
Co Rel = Canonical Tag není
Mnoho lidí se domnívá, že pokud přidáte odkaz rel = canonical na stránku, bude tato stránka přesměrována na kanonickou verzi, například přesměrování HTTP 301. To není pravda. Rel = kanonický odkaz poskytuje informace vyhledávačům, ale nemá vliv na to, jak je stránka zobrazena, ani na přesměrování na úrovni serveru .
Kanonická vazba je v konečném důsledku pouze náznakem. Vyhledávače to nemusí ctít. Většina vyhledávačů usilovně usiluje o respektování přání majitelů stránek, ale na konci dne jsou výsledky vyhledávání to, co dělají, a pokud nechtějí sloužit vaší kanonické stránce, nebudou.
Kdy použít Canonical Link
Jak jsem uvedl výše, měli byste použít odkaz na každé duplicitní stránce, která není kanonická. Pokud máte stránky, které jsou podobné, ale nejsou totožné, někdy je více smysl změnit jednu z nich tak, aby se lišila, než vytvořit jednu kanonickou.
Je v pořádku označit dvě stránky, které nejsou zcela totožné jako kanonické. Měli by být podobné, ale nikdy byste neměli jednoduše ukládat všechny stránky na domovskou stránku. Canonical znamená, že stránka je hlavní kopií tohoto dokumentu, nikoli jakýkoli hlavní odkaz na vašem webu.
Myslím, že je důležité opakovat poslední bit - nikdy byste neměli ukazovat všechny vaše stránky na vaši domovskou stránku jako kanonickou stránku bez ohledu na to, jak jste v pokušení to udělali. Pokud to uděláte, i náhodou může být každá stránka, která není kanonická (tj. Každá stránka, která není vaší domovskou stránkou a má na ní rel = canonical odkaz) odebrána z indexů vyhledávačů.
To není Google (nebo Bing nebo Yahoo! nebo jiný vyhledávač) být škodlivý. Dělají to, co jste o ně požádali - uvažovat každou stránku s duplikátem vaší domovské stránky a vrátit všechny výsledky na tuto stránku. Poté, když se zákazníci dostanou do frustrace a skončí na vaší domovské stránce místo relevantnějšího dokumentu, bude tato stránka méně populární a bude klesat ve výsledcích vyhledávání. Dokonce i když problém vyřešíte, můžete výsledky hledání za měsíce později zabít a neexistuje žádná záruka, že se vaše hodnocení stránek obnoví.
Neměli byste vytvořit nějakou kanonickou stránku, která byla z nějakého důvodu vyloučena z vyhledávání (například meta tag noindex nebo vyloučená v souboru robots.txt). Aby vyhledávací nástroj odkazoval na stránku jako kanonickou, musí ji nejprve odkazovat.
K dobrému místu, kde můžete použít odkaz rel = canonical, patří:
- Weby s dynamickými adresami URL - můžete je použít k určení toho, který formát URL preferujete
- Weby elektronického obchodu, zejména seznamy produktů - Pokud zákazníci mění kritéria řazení, tato nová adresa URL nemusí být indexována
- Syndikovaný obsah - majitelé stránek, kteří používají obsah, který jste napsali, by měly obsahovat rel = canonical odkaz na svých stránkách, které směřují k vašemu původnímu dokumentu
Pokud nepoužíváte Canonical Link
Vaše první volba by měla být přesměrování 301. To nejen informuje vyhledávač, že se změnila adresa URL stránky, ale také přenáší lidi na nejnovější verzi stránky (a odvážím se říci, canonicol?).
Nebuď líný. Pokud změníte strukturu adres URL, použijte nějakou formu manipulace se záhlavím HTTP (například .htaccess nebo PHP nebo jiný skript), abyste přidali přesměrování 301 automaticky.
Zatímco můžete použít odkaz rel = canonical, který nezahrnuje starší stránky dolů. A tak se k nim může kdykoli dostat. Ve skutečnosti, pokud má zákazník stránku se záložkou a změníte adresu URL, ale pouze aktualizujete vyhledávače pomocí rel = canonical link, tento zákazník nikdy neuvidí novou stránku.
Rel = kanonický odkaz je užitečný nástroj pro weby s množstvím duplicitního obsahu. Porozuměním, jak funguje, můžete je efektivně využívat. Ale nakonec je to nástroj, který byl vydán vyhledávači, aby jim pomohl udržet jejich vyhledávací indexy aktuální. Pokud nechcete servery udržovat čisté a aktuálně také, budou vaši zákazníci ovlivněny a vaše stránky by mohly být zraněny. Používejte ho zodpovědně.