Canonical таг – обяснение и употреба

Canonical тагът е един от основните инструменти на SEO специалистите, с които да решат някои от най-досадните си проблеми – дублирано съдържание или понякога неточно индексиране.

Естество на проблема

Интернет е пълен със съдържание. Толкова пълен, че често е трудно когато се пише такова да не се получи дублиране с друга страница, която вече има подобно съдържание.  Или пък често се случва по една или друга причина съдържанието на една страница да се е твърде подобно на друга – цитира се като източник, едната съдържа втората, структурата на един сайт го изисква или просто едната страница е продължение на другата. Когато търсачките се сблъскат с такъв случай те често имат проблем с това дали и как да индексират дублираните страници и това често води до проблеми с въпросното индексиране.

Canonical тагът служи за решаването на този основен проблем. Да го кажем по прост начин – със слагането на каноничен таг вие указвате на търсачките, че въпросната страница към която сочи въпросния таг е каноничната или предпочитаната, когато става въпрос за индексиране. Те трябва да не обръщат внимание на текущата, а да се обърнат към нея – тя е главната, основната, първообраза, източника, корена – тя трябва да бъде тази, която да се индексира и каквато и тежест може да се придобие от съдържанието да отиде към нея.

Технически изпълнението му сравнително просто – в head частта на страницата се поставя ред подобен на този:


<link rel="canonical" href="https://serpact.bg/canonical/" />

Ефектът е сходен на този, който би се получил ако страницата, чийто каноникъл таг сочи към друга страница, би била изтрита и би се сложил 301 редирект към въпросната друга страница. На теория е лесно и просто. На практика да се знае кога и дали да се сложи тага понякога е проблематично.

Ние ще се опитаме да дадем някои основни примери и препоръки въз основа на опита си в тази насока.

1. Когато една страница съдържа значителна част от съдържанието на друга или я копира изцяло.

Често се случва когато се пише съдържание описващо един и същ или сходен елемент.

Например имате сайт продаващ тениски. Имате една тениска в два варианта – бяла и черна, единствената разлика е в цената и евентуално в една или две думи в описанието. Двете тениски представляват вариация на един и същ продукт. Когато търсачката премине през двете страници и анализира съдържанието им, тя веднага може да прецени, че то е почти еднакво и ще го отчете като дублирано съдържание със съответния ефект върху индексирането им. В този случай трябва да се прецени дали единия адрес да се сложи като каноничен и съответно да се индексира и да поеме тежестта и на двата продукта или да се коригира съдържанието на двете вариации, така че да се получи достатъчна разлика за да могат и двете да бъдат индексирани.

В най-честия случай тук бихме препоръчали да се сложи каноникал. Така тежестта на единия продукт би била по-голяма и съответно той би се представил по-добре при евентуално търсене отколкото двата различни продукта поотделно. Когато е по-видим в търсачките той би привлякъл повече кликове, а потребителите, които извършват такова търсене и пазаруване в мрежата се свикнали и дори очакват да намерят различни варианти на търсения си продукт, дори и такива които биха ги убедили да променят или разширят намерението си какво да купят.

Друг специфичен подобен случай биха били FAQ страниците и страниците с отговори на различни въпроси. Ако имате различни страници с различни въпроси и отговори към тях и една обща страница, които ги обединява, то е логично да се заключи че търсачките ще заключат, че има дублирано съдържание и на пръв поглед решението би било да се сложи на страниците на въпросите каноникъл, за да се избегне тази грешка и да се увеличи тежестта на основната.

Тук обаче идва въпроса за релевантността и специфичността. При търсенето на отговор на специфичен въпрос търсачките ще дадат предимство на страниците, чието съдържание е в по-голяма степен свързано с темата на търсенето, семантично, тематично и специфично. В този случай една страница посветена на определен въпрос би имала по-голяма тежест от такава, която покрива по-общ диапазон от въпроси. За по-добро представяне на тези страници тогава каноничния таг може би не би бил подходящ, а би било по-добре да се потърси как избегне грешката, без да се ограничава индексирането на въпросните страници.

2. Когато има дублиране на заглавни тагове и мета описания.

Случва се често при страницирано съдържание – при блогове, новини, категорийни страници по една или друга тема или продуктови категорийни или групови страници.

На теория prev, next релациите би трябвало да решат проблема с индексирането на съдържанието. На теория еднакъв заглавен таг би указал на търсачките, че става въпрос за една и съща страница. На практика Google се описва да индексира и категоризира всичко. Съдържанието на такъв тип страници обаче почти винаги е динамично – това което днес е било на страница едно, утре може е да на две или три. Търсачките го преиндексират значително по-рядко, така че често може да се получи, че линк получен като отговор на такова търсене може да се окаже не това, което потребителя търси, ако се индексират така страниците.

Честото добавяне или промяна на съдържание на този тип страници влияе и на общата им семантика – цялостната тема и съдържание може да се отклони от началната или да се стесни и специализира, което да се отрази на това как търсачките виждат тези страници. Затова и те принципно подават значително по-голяма тежест на публикациите, новините или продуктите, които са включени в тях. Те поне рядко се променят и Google може да разчита на едно сравнително постоянство в съдържанието им. Трябва да се прецени същи и дали искаме да имаме всички тези категорийни страници с SERPа на сайта.

Ако имаме малко на брой такива страници и / или можем да сме сигурни че съдържанието им остава сравнително постоянно и се отличава достатъчно в страницираните си части, тогава може да се потърси вариант да се направи така че заглавията и мета описанията да се отличават. В противен случай сериозно се препоръчва поставянето на каноникъл таг на страницираното съдържание.

3. Страници с динамични URL адреси.

Често в създаването на един сайт може да ни наложи да използваме различни способи за да може потребителя по-бързо и лесно да достигне до желаното съдържание, чрез филтри, търсачки или подобни елементи.

Обикновено това се осъществява с добавянето на параметри към адреса на страниците (? в URL). Търсещите машини обаче разпознават така получените адреси и ги индексират поотделно, което значително увеличава размера на страниците в сайта, генерира дублирано съдържание, добавя дублирани заглавни тагове и мета описания.

Най-често проблема се решава като се забрани индексирането на такъв тип страници (най-често през robot.txt и така се спестява обхождането на значителен брой страници и се пести от кроул бюджета на сайта). Понякога обаче това не е подходящ метод – например ако параметрите се използват в друга част на сайта и вие искате индексирането там да си остане както е. Тогава се препоръчва да се постави каноникъл таг на страниците с параметрите, сочещ към релевантна страница, която да служи като техен оригинал.

4. В случаи когато се ъпдейтва съдържание, иска се да се запази статия адрес, но SEO активите, натрупани от него да се пренасочат към новата страница.

Тогава rel=“canonical“ се слага и се постига желания резултат. Съдържанието може да не е задължително такова в буквалния смисъл на думата – то може да се отнася за продукти, които вече не се предлагат (изчерпани, не се произвеждат вече, има нови модели), които да се канонизират към заместителите им. Може да става въпрос за събития, които са изтекли, но идват нови от този тип, които могат да спечелят от тежестта натрупана от предходните. Вариантите са много. Поставянето на каноничен таг в този случай би било подходящо.

Неправилно подставен каноничен таг и неговите рискове

1. Канонизиране на страници които са забранени за индексиране

Понякога, когато се прави ъпдейт към ново съдържание, може да се реши да се забрани индексирането на страницата, носеща старото съдържание.

Мислите си – имаме нова версия, сложили сме каноникъл таг да го посочим от известно време, нека сложим noindex на старата и да спестим на паяка усилието да я обхожда. И се създава проблем. Докато една страница съществува и не е премахната от индекса тя все още носи своята тежест, дори и да я предава чрез rel=“canonical“ на друга страница. Сложи ли се noindex, спрете ли процеса на  обхождане robots.txt или друга забрана за индексиране, вие практически казвате на Гугъл да забрави за тази тежест. Той вече дори не може да премине през нея и да види канонизиращия таг, за да продължи да прехвърля тежест. Съответно това ще се отрази съществено на ранка на новата страница, както и на всички останали страници, чийто ранк зависи от нея.

2. Канонизиране към страници които са забранени за индексиране или имат 404

Много по-често срещана грешка. Случва се основно когато се допусне грешка при изписването на URL адреса в каноникъл тага или той сочи към версия на страницата, която не е достъпна.

Например ако се изпусне наклонената черта на края на адреса, добави се двойна такава след името на домейна или просто грешка в изписването. В този случай се случва следното: Ботът обхожда страницата с каноникъл тага и вижда съобщението „Не обръщай внимание на тази страница, тя е версия на ето тази друга“. Той казва „Ами добре“, отива на другата и вижда, че няма как да я индексира, нито как да класифицира съдържанието. Съответно според полученото указание канонизираната страница получава нулева тежест и стойността й в сайта изчезва.

3. Верижно канонизиране

Получава се понякога когато се правят често актуализации на едно съдържание.

За пример имате страница page1 , тя е индексирана от търсачките, категоризирана и се представя добре. След известно време решавате да актуализирате съдържанието – създавате втора страница page2 и слагате каноникъл на първата към нея, за да прехвърли тежестта й. След още време създавате страница 3 page3 и слагате на page2 каноникъл към нея. Каноникъл тагът работи на основата на оценка на съдържание. В този случай когато погледне страници една и две, той ще се затрудни с това какво да прави със съдържанието, понеже страница две вече няма да е достъпна за работа с нея.

По принцип търсачките може да прехвърлят тежестите към страница три, но може и да не го направят. Особено ако след това имате страница 4, 5 или 7 и особено ако някоя от тези страници междувременно е получила код 404 или е премахната от индексиране. В този случай се препоръчва или да изтриете старите страници и да направите редирект 301 към най-новата или ако се прецени че това не е целесъобразно да промените каноникъл тага всички страници така че те да сочат директно най-новата.

4. Канонизиране на много страници към една.

Често правена грешка е да се реши в един сайт страниците му да се канонизират към една или няколко основни страници с намерението цялата тежест да се пренасочи към тези страници.

На теория идеята би следвало да проработи. На практика нещата не стоят по този начин. Каноникъл тага служи за контролиране на сходно съдържание в различни страници. В този случай търсачките ще прегледат основните страници, ще категоризират и индексират тяхното съдържание.

От всички други страници, които са канонизирани към тях те ще вземат само тези които са имали индексирано сходно съдържание и от тях само тежестта на това съдържание, за да го добавят към тази на основните страници. Всяко различно съдържание и всяка тежест, която е то е натрупало автоматично се губи като нерелевантно. Съответно се губи и ползите, които то носи на самите страници и на сайта като цяло, което автоматично се отразява на класирането му.

В заключение

За доброто класиране на един сайт съдържанието и структурата му са едни от основните фактори. Правилното им управление може да вдигне или понижи класирането му, затова нашия съвет е много да внимавате, когато използвате каноникъл тага. Правилното му използване би донесло значителни SEO ползи, а лошото може да срине ранкинга му.

Старайте се структурата на подаването му да проста и чиста и когато е възможно използвайте Redirect 301 вместо него. За щастие разрешаването на тези грешки е сравнително бързо и просто. Извършването на периодични SEO анализи може да доведе откриването на този тип проблеми и разрешаването им преди да са нанесли огромни вреди.