Обзор на уебинар с Бил Славски

На 25 април 2019 година Серпакт проведе седмият си пореден уебинар от поредицата Серпаск с една от иконите на SEO индустрията в света – Bill Slawski. Той е израстнал на брега на Ню Джърси, е учил в Университета в Делауеър и в юридическото училище Widener University. Докато работи като юридически и технически администратор в Висшия съд на Делауеър, той изгражда първия си уеб сайт и се научава как да го популяризира, включително това е и шанс да започне да учи за SEO. Докато работи като SEO, Bill започва да изследва и пише за патенти и документи за Google, които той продължава да прави днес като директор на SEO изследвания за Go Fish Digital.

Дидо Григоров: За нас от Серпакт е огромна чест да приветстваме с добре дошъл като наш специален гост – Бил Славски. Бил разкажи ни малко повече за себе си. Как точно започна с уеб и как след това се прехвърли към SEO? Сподели малко повече детайли за това.

Бил Славски: Учех право и бях асистент на мой професор по Федерално право, когато той ми даде тестова задача да анализирам документ, написан от него, използвайки електронни бази данни за проучване на цената на щетите на природните ресурси. Това беше и първият ми допир с нещо подобно на интернет сега, имайте предвид, че това беще малко преди да се появи Интернет като цяло. Когато започнах с интернет, го направих с мисълта да се ангажирам с нещо, което ще даде на хората релевантна информация на проблемите в техния живот. Първият ми уебсайт беше за компания, която се занимава с основава на фирми за клиенти в Делауеър, като за клиентите географското положение беше важно.

Дидо Григоров: Историята на началото на твоята кариера е забележителна, определено! Нека скочим към патентите на Гугъл, тъй като ти си топ личността на планетата, която успешно успява да ги анализира ида ги направи разбираеми за хората. Нека чуем обяснението на Бил Славски за това какво е Гугъл патент, как можем да го дефинираме?

Бил Славски: Така, разглеждането само на един патент е като музикант само с една нота. Няма как да знаете дали Гугъл използва този патент или не. Понякога има доказателства, че дадено нещо се използва, защото вече си го виждал имплементирано в уеб. Именно такъв е случаят с патента за универсално търсене, който казва, че се поставят вертикални търсения, заедно със същия сет от резултати при търсене, така че търсенето вече не е просто списък от 10 сини линки, а резултати с изображения, локални резултати, новини. Всичко това е микс от неща.

Често се случва към даден патент да имаме и continuation патент, или това означава пре-внасяне на патент за потвърждаване. Така, обаче не се променят описанието и заглавието му, а само твърденията в патента и така всъщност се показва, че има нещо ново. Именно това помага и на хората, които одобряват патентите да вземат решение дали да ги одобрят или не.

Един от последните патенти, появи ли се на скоро носи заглавието „Image search with semantic entities“. В основата си този патент казва, че изображенията ще бъдат организирани спрямо етикети, съгласно онтологии.  Така ако търсим например изображения за Джордж Уошинтън, ние ще видим и неща асоциирани с живота му и неговото президентсво. Етикетите на изображенията се вземат и от търсенията на хората в Гугъл, които технологията на търсачката взима и използва съгласно резултатите за дадени етикети.

Никола Минков: Бил, защо според теб патентите са важни?

Бил Славски: Ок, когато нещо е официално публикувано от компания свързана с уеб, често си казваме, че то може да е написано от маркетинг департамента на компанията и той да е изиграл важна роля. С патентите е различно, защото тук компанията трябва да убеди Patent Office-a в Америка, че това, което иска да бъде патентовано си струва да е патентовано. Освен това, доста хора влагат усилия и труд за създаването на дадена технология и патентоването й. Ако дадено нещо е патентовано официалн осамо с един документ, то вероятността да не се използва е голяма, но съвсем различен е случаят с phrase-based патентите, които са около 20 на брой. Когато видиш такава бройка патенти си казваш „Има нещо тук, което със сигурност се използва“.

Дидо Григоров: Каква според теб е корелацията между патентите и реалната им имплементация? Тествал ли си нещо от патент, което вече е имплементирано?

Бил Славски: В случая с phrase-based indexing патентите, когато оптимизирате страница за дадена фраза, разгледайте и останалите документи, 10 или 100, и обърнете внимание на пълнозначни, смислени фрази, които се употребяват около вашата фраза. Ако подготвяте страница за Белия дом, то със сигурност ще срещнете и фразата „Американски президент“. Това има доста сериозно влияние върху класиранеот и е нещо, което копирайтърите понякога правят по доста натурален начин, като поглеждат например заглавията на конкурентите по дадена тема.

Дидо Григоров: Бил, мислиш ли, че phrase-based indexing патентите имат общо с машин лърнинг технологиите и оформянето на натурален език?

Бил Славски: Едно от нещата, които харесвам относно phrase-based indexing патентите е техният брой, а също и фактът, че освен един индекс, в който имаме думите срещани в документите и инвертирани понятия, то в един от патентите се казва, че е създаден и инвертиран индекс, който представя фрази с цел крос референции, кръстосани препратки. Така че, това не е точно езиков модел, а по-скоро нещо, което може да прави кръстосани препратки с инвертирани индекси на думи и инвертирани фрази.

Дидо Григоров: Ок, да поговорим за последните патенти, които си анализирал на блога си SEObythesea. Доста оригинално има, между другото, за блог.

Бил Славски: Помага ти да избереш темата лесно по правилния път. Споменах вече за семантичните изображения и патентът за тях, освен него, нещо, което излезе напоследък се отнася до същностите и техните характеристики и доколко можем да им се доверим. Отново споменаваме същностите, нещо което ще играе все по-голяма роля според мен за Гугъл във времето. Този документ е написан от създателя на Schema.org и Google Custom Search Engines – Ramanathan Guha. В първия си документ, той казва, че даден сайт може да бъде обект на доверие, защото хората го търсят или казват точно това със заявките си при търсене в custom search engines. При втория си документ, той вече говори за същности, техните характеристики и доколко можем да им се доверим.

Никола Минков: Бил, в един от забележителните ти туитове, ти казваш, че може да има връзка между маркирането на таблици със структурни данни и featured snippet резултатите в Гугъл с таблици. Какво мислиш за това?

Бил Славски: Първият патент за това, говореше основно за featured snippets извеждащи неструктурирани данни или с други думи просто текст, отговор на даден въпрос, които Гугъл „складира“ в складове за данни. Чухме също хора като Джон Мюлер, който каза, че не използват структурни данни при featured snippets. Последващи патенти обаче казват, че ще се взимат въпроси от заглавия, структурирана информация, и тя ще се поставя в „складове за данни“. Последния патент за това, говори за пасажи на отговор към даден въпрос, при който отговорът се намира в неструктурирани данни на документи и структурирани такива факти наприемр като таблици. Но Гугъл не казват никъде нещо за Schema.org.

И макар наистина към момента Гугъл да не използва Schema.org маркиране, мисля че скоро ще се случи, имайки предвид новите формати маркиране каквото е FAQ. Или с други думи това означава – „Собственици на бизнеси, напишете въпросите, напишете и отговорите, и това ще има потенциалът за featured snippet“.

Дидо Григоров: В един от последните документи на Гугъл, четох, че те използват система от типа – въпрос/отговор. Мислиш ли, че features snippets са свързани с това, какво е мнението ти?

Бил Славски: Всъщност Гугъл започнаха да показват отговори на въпроси още през 2005та година в проекта си Google DNA. Те официално обявиха, че ще започнат да го правят, защото това искат хората от тях – директни отговори на въпроси. По-късно се появи Гугъл Колибри, което измерва същности и вече можеха да се задават въпроси. Сега вече имаме featured snippets, people also ask. Бих нарекъл това метаморфоза, различен начин на „комуникация“ между търсачките и потребителите.

Никола Минков: Бил, един от най-дискутираните въпроси в SEO индустрията днес е този за дублираното съдържание. Има ли патент, който го разисква?

Бил Славски: В разговор между мен и представители на Гугъл, в Google Hangouts On Air, много пъти те са казвали, че Гугъл няма наказание за дублирано съдържание, но той има филтър. Може би затова, когато търсим нещо, понякога най-отдолу виждаме линк с резултати, които са подобни на тези и може да кликнете тук, за да ги видите.

Не винаги е проблем ако основната информация се намира на вашия сайт и тази информация се е разпространила в уеб. Има патент, който казва за идентифицирането на страница, която може да е дублирана, с нейния автор, и съответно изчисляването на author scores, съгласно хората, които цитират тези автори в уеб. Възможно е също Гугъл да използват езикови модели базирани на енграми и така да преценят коя версия на документа да представят, извън филтрираните резултати, базирано на концепцията, че един от тези документи е основната версия.

Дидо Григоров: Бил, забелязали сме, че хора като Джон Мюлер често използват думи като patterns / patternization при идентифицирането на дублирано съдържание. Какво мислиш за това? Това ли е технологията, която използват за дублирано съдържание?

Бил Славски: Патернизацията като цяло не е нещо необичайно. Самият Сергей Брин излезе с документ за използването на patterns при извличането на информация и даде пример с 5 книги с техните данни за публикуване, автори, резюмета и тн,, които Гугъл трябва да търси и да записва информация за другите споменати книги отново и отново, наравно с първите 5 книги. И макар книгите да не бяха наречени същности, те всъщност бяха и са същности – книги и свойства, характеристики за тях.

Скорошен патент говори за същности и заявки за търсене като същности, уеб страницат като същност и тн., и те търсят patterns свързани с същностите на търсене. Към това те асоциират и спам оценка. Така се идентифицират и страниците, които са спам, на базата на patterns между тези същности на търсене.

Никола Минков: Добре, Бил, нашият следващ въпрос е относно твоят пост за augmentation queries. Ние, принципно, прекарваме доста време, четейки твоят блог и точно за този пост един дне бяхме дискутирали темата с Дидо почти 10 часа.

Дидо Григоров: Да, определено! Аз бях прочел поста над 50 пъти! Как Гугъл преценява заявките според теб, Бил?

Бил Славски: Един от примерите, който винаги давам, е този с хората, които използват последната версия на Schema и ясно се откроява развитието на Schema спрямо определени дейности, които изискват специализация. Ако имаме, например, водопроводчик и имаме страница за поправка на дренаж, то ние можем да маркираме страницата освен с тип Schema.org за водопроводчик, но и за специализация в поправка на дренажи. Отделно Гугъл може да използва информацията от Структурните данни, за да вземе заявка и да тества как потребителите биха реагирали на нея. Така ако търсим „Водопроводчик в Лос Анджелис“, а след това и „Поправка на дренажи Лос Анджелис“, то може да видим подобни или същите резултати.

Дидо Григоров: Преди да зададем финалните ни въпроси, имаме още един специален въпрос относно серията от 10те най-важни патента за SEO. Според теб, кой от тези патенти е най-важен и защо?

Бил Славски: Доста труден отговор. Един от най-важните патенти, който дори не беше патент в началото, е този за PageRank. В него се обяснява за пръв път идеята за класиране на база референции / линкове към даден сайт и оценки от порядъка на 768, изписани в патента от самия Лари Пейдж. Следващият след него е може би този за сигналите за класиране, според който търсачката използва information retrieval scores & authority scores, за да класира резултати. Гугъл бяха признали също, че гледат линковете и авторитетността на един сайт, и не класират дадена статия, само заради страницата й, а и заради самият сайт.

Дидо Григоров: Ок, по традиция винаги питаме нашите гости за тенденциите в SEO. Какво мислиш, Бил, можем ли да очакваме някакви изненади до края на годината?

Никола Минков: И как би следвало да променим стратегиите си за оптимизация за търсачки?

Бил Славски: Повреме на уебинара, аз говорих доста за семантика и същности и мисля, че Гугъл ще продължат да се развиват в тази посока. Например към момента аз ъпдейтвам SEOByTheSea, като смятам да превърна всеки патент в същност, една еволюция, която съм започнал. Уверете се, че разбирате какво са същностите и ги използвайте.

Никола Минков: Имаме много въпроси от нашата аудитория, но имаме време за 1 или 2, и един от тях е на Анна Милева, която пита „Колко патента има Гугъл към момента и колко от тях се използват за ранкинг?“

Бил Славски: Трудно е да се каже колко съществуват! Аз съм писал за, вероятно, повече от 1000. Интересна е намаляващата тенденция на публикувани патент-документи от Гугъл. Някои от тях са вече одобрени от US Patent Office, други са внесени, но не и одобрени все още. Сега на седмица тези патенти са от 3 до около 5, а преди бяха 50-60 седмично. Освен това, Гугъл публикува понякога подобни патенти, но с различни имена.

Никола Минков: Нашият втори и последен въпрос, защото нямаме повече време. Има ли връзка между конзолата на Гугъл и патентите му?

Бил Славски: Има няколко патента, които обясняват какво е Google Search Console, при разработването си във времето. Някои неща от тях не са имплементирани към момента, като например да указваме на GoogleBot кога е най-доброто време от деня да обхожда страниците ни. И така това никога не видя бял свят, но представете си за секунда да кажете на Гугъл: „Обхождай страниците ми между 1 и 3 през нощта“ 🙂