Обзор на уебинар с Бил Славски

На 25 април 2019 година Серпакт проведе седмия си пореден уебинар от поредицата Серпаск с една от иконите на SEO индустрията в света – Bill Slawski.
bill-slawski-1024x536

На 25 април 2019 година Серпакт проведе седмия си пореден уебинар от поредицата Серпаск с една от иконите на SEO индустрията в света – Bill Slawski. Той е израстнал на брега на Ню Джърси Шор, е учил в Университета в Делауеър и в юридическото училище Widener University. Докато работи като юридически и технически администратор във Висшия съд на Делауеър, той изгражда първия си уеб сайт и се научава как да го популяризира, включително това е и шанс да започне да учи за SEO. Докато работи като SEO, Bill започва да изследва и пише за патенти и документи за Google, които той продължава да прави днес като директор на SEO изследвания за Go Fish Digital.

Дидо Григоров: За нас от Серпакт е огромна чест да приветстваме с добре дошъл като наш специален гост – Бил Славски. Бил, разкажи ни малко повече за себе си. Как точно започна с уеб и как след това се прехвърли към SEO? Сподели малко повече детайли за това.
Бил Славски: Учех право и бях асистент на мой професор по Федерално право, когато той ми даде тестова задача да анализирам документ, написан от него, използвайки електронни бази данни за проучване на цената на щетите на природните ресурси. Това беше и първият ми допир с нещо подобно на интернет, сега, имайте предвид, че това беще малко преди да се появи Интернет като цяло. Когато започнах с интернет, го направих с мисълта да се ангажирам с нещо, което ще даде на хората релевантна информация на проблемите в техния живот. Първият ми уебсайт беше за компания, която се занимава с основаване на фирми за клиенти в Делауеър, като за клиентите географското положение беше важно.

Дидо Григоров: Историята за началото на твоята кариера е забележителна, определено! Нека скочим към патентите на Гугъл, тъй като ти си топ личността на планетата, която успешно успява да ги анализира и да ги направи разбираеми за хората. Нека чуем обяснението на Бил Славски за това какво е Гугъл патент, как можем да го дефинираме?

Бил Славски: Така, разглеждането само на един патент е като музикант само с една нота. Няма как да знаете дали Гугъл използва този патент или не. Понякога има доказателства, че дадено нещо се използва, защото вече си го виждал имплементирано в уеб. Именно такъв е случаят с патента за универсално търсене, който казва, че се поставят вертикални търсения, заедно със същия сет от резултати при търсене, така че търсенето вече не е просто списък от 10 сини линки, а резултати с изображения, локални резултати, новини. Всичко това е микс от неща.

Често се случва към даден патент да имаме и continuation патент, или това означава пре-внасяне на патент за потвърждаване. Така обаче не се променят описанието и заглавието му, а само твърденията в патента и така всъщност се показва, че има нещо ново. Именно това помага и на хората, които одобряват патентите да вземат решение дали да ги одобрят или не.

Един от последните патенти, появили се наскоро носи заглавието „Image search with semantic entities“. В основата си този патент казва, че изображенията ще бъдат организирани спрямо етикети, съгласно онтологии.  Така, ако търсим например изображения за Джордж Уошинтън, ние ще видим и неща асоциирани с живота му и неговото президентсво. Етикетите на изображенията се вземат и от търсенията на хората в Гугъл, които технологията на търсачката взима и използва съгласно резултатите за дадени етикети.

Никола Минков: Бил, защо според теб патентите са важни?

Бил Славски: Ок, когато нещо е официално публикувано от компания, свързана с уеб, често си казваме, че то може да е написано от маркетинг департамента на компанията и той да е изиграл важна роля. С патентите е различно, защото тук компанията трябва да убеди Patent Office-a в Америка, че това, което иска да бъде патентовано си струва да е патентовано. Освен това, доста хора влагат усилия и труд за създаването на дадена технология и патентоването й. Ако дадено нещо е патентовано официално само с един документ, то вероятността да не се използва е голяма, но съвсем различен е случаят с phrase-based патентите, които са около 20 на брой. Когато видиш такава бройка патенти си казваш „Има нещо тук, което със сигурност се използва“.

Дидо Григоров: Каква според теб е корелацията между патентите и реалната им имплементация? Тествал ли си нещо от патент, което вече е имплементирано?

Бил Славски: В случая с phrase-based indexing патентите, когато оптимизирате страница за дадена фраза, разгледайте и останалите документи, 10 или 100, и обърнете внимание на пълнозначни, смислени фрази, които се употребяват около вашата фраза. Ако подготвяте страница за Белия дом, то със сигурност ще срещнете и фразата „Американски президент“. Това има доста сериозно влияние върху класирането и е нещо, което копирайтърите понякога правят по доста натурален начин, като поглеждат например заглавията на конкурентите по дадена тема.

Дидо Григоров: Бил, мислиш ли, че phrase-based indexing патентите имат общо с машин лърнинг технологиите и оформянето на натурален език?

Бил Славски: Едно от нещата, които харесвам относно phrase-based indexing патентите е техния брой, а също и фактъ, че освен един индекс, в който имаме думите, срещани в документите и инвертирани понятия, то в един от патентите се казва, че е създаден и инвертиран индекс, който представя фрази с цел крос референции, кръстосани препратки. Така че, това не е точно езиков модел, а по-скоро нещо, което може да прави кръстосани препратки с инвертирани индекси на думи и инвертирани фрази.

Дидо Григоров: Ок, да поговорим за последните патенти, които си анализирал на блога си SEObythesea. Доста оригинално име, между другото, за блог.

Бил Славски: Помага ти да избереш темата лесно по правилния път. Споменах вече за семантичните изображения и патента за тях, освен него, нещо, което излезе напоследък се отнася до същностите и техните характеристики и доколко можем да им се доверим. Отново споменаваме същностите, нещо което ще играе все по-голяма роля според мен за Гугъл във времето. Този документ е написан от създателя на Schema.org и Google Custom Search Engines – Ramanathan Guha. В първия си документ, той казва, че даден сайт може да бъде обект на доверие, защото хората го търсят или казват точно това със заявките си при търсене в custom search engines. При втория си документ, той вече говори за същности, техните характеристики и доколко можем да им се доверим.

Никола Минков: Бил, в един от забележителните ти туитове ти казваш, че може да има връзка между маркирането на таблици със структурни данни и featured snippet резултатите в Гугъл с таблици. Какво мислиш за това?

Бил Славски: Първият патент за това, говореше основно за featured snippets извеждащи неструктурирани данни или с други думи просто текст, отговор на даден въпрос, който Гугъл „складира“ в складове за данни. Чухме също хора като Джон Мюлер, които казаха, че не използват структурни данни при featured snippets. Последващи патенти обаче казват, че ще се взимат въпроси от заглавия, структурирана информация, и тя ще се поставя в „складове за данни“. Последният патент за това говори за пасажи на отговор към даден въпрос, при който отговорът се намира в неструктурирани данни на документи и структурирани такива факти наприемр като таблици. Но Гугъл не казват никъде нещо за Schema.org.

И макар наистина към момента Гугъл да не използва Schema.org маркиране, мисля че скоро ще се случи, имайки предвид новите формати маркиране – каквото е FAQ. Или с други думи това означава – „Собственици на бизнеси, напишете въпросите, напишете и отговорите, и това ще има потенциалът за featured snippet“.

Дидо Григоров: В един от последните документи на Гугъл, четох, че те използват система от типа – въпрос/отговор. Мислиш ли, че features snippets са свързани с това, какво е мнението ти?

Бил Славски: Всъщност Гугъл започнаха да показват отговори на въпроси още през 2005та година в проекта си Google DNA. Те официално обявиха, че ще започнат да го правят, защото това искат хората от тях – директни отговори на въпроси. По-късно се появи Гугъл Колибри, което измерва същности и вече можеха да се задават въпроси. Сега вече имаме featured snippets, people also ask. Бих нарекъл това метаморфоза, различен начин на „комуникация“ между търсачките и потребителите.

Никола Минков: Бил, един от най-дискутираните въпроси в SEO индустрията днес е този за дублираното съдържание. Има ли патент, който го разисква?

Бил Славски: В разговор между мен и представители на Гугъл, в Google Hangouts On Air, много пъти те са казвали, че Гугъл няма наказание за дублирано съдържание, но той има филтър. Може би затова, когато търсим нещо, понякога най-отдолу виждаме линк с резултати, които са подобни на тези и може да кликнете тук, за да ги видите.

Невинаги е проблем, ако основната информация се намира на вашия сайт и тази информация се е разпространила в уеб. Има патент, който казва за идентифицирането на страница, която може да е дублирана с нейния автор, и съответно изчисляването на author scores, съгласно хората, които цитират тези автори в уеб. Възможно е също Гугъл да използват езикови модели, базирани на енграми и така да преценят коя версия на документа да представят, извън филтрираните резултати, базирано на концепцията, че един от тези документи е основната версия.

Дидо Григоров: Бил, забелязали сме, че хора като Джон Мюлер често използват думи като patterns / patternization при идентифицирането на дублирано съдържание. Какво мислиш за това? Това ли е технологията, която използват за дублирано съдържание?

Бил Славски: Патернизацията като цяло не е нещо необичайно. Самият Сергей Брин излезе с документ за използването на patterns при извличането на информация. Даде пример с 5 книги: с техните данни за публикуване, автори, резюмета и т.н., които Гугъл трябва да търси и да записва информация за другите споменати книги отново и отново, наравно с първите 5 книги. И макар книгите да не бяха наречени същности, те всъщност бяха и са същности – книги и свойства, характеристики за тях.

Скорошен патент говори за същности и заявки за търсене като същности, уеб страница като същност и тн., и те търсят patterns, свързани с същностите на търсене. Към това те асоциират и спам оценка. Така се идентифицират и страниците, които са спам – на базата на patterns между тези същности на търсене.

Подобни статии