Как работи Google Search, какво е PageRank и как е започнало всичко?

Едва ли има някой, който не знае какво е Google или по точно търсачката Google Search. Популярната търсеща машина гъвкаво се адаптира към изискванията на времето и предлага все повече удобства.

Дори най-малките интуитивно се ориентират, че могат да я ползват чрез гласово търсене. Google не рядко се възприема, като съвременна енциклопедия – знае всичко и отговаря на всеки въпрос, а отговорите се възприемат с голяма степен на достоверност.

А замисляли сте се – как Google се ориентира в морето от сайтове – кой точно да покаже? Как определя по зададен въпрос – кой сайт предоставя правилния отговор? По въведена ключова дума – как Google подрежда сайтовете в резултатите от търсенето (SERP)?

Един потребител, вероятно не се замисля – просто пита в Google, получава отговор и го консумира. А собствениците на сайтове се борят за своето място под Слънцето или казано с други думи – за челни позиции в SERP-а на Google.

Разбира се, в основата на всичко лежат сложни математически функции. Google не предлага случайни резултати по дадено запитване, а най-точните, достоверни и потвърдени от авторитети с най-висок PageRank.

Какво е PageRank на Google?

PageRank (PR) е алгоритъм, който търсачката Google прилага, за да класира страниците в нета и да ги подреди (ранкира) в резултатите по дадено търсене. Но не всяка страница в има привилегията да получи тази оценка.

Интернет се увеличава с всеки изминал ден. Обемът на информацията в нета расте, а обхождането на дадена страница и оценяването й със сложни математически алгоритми, за да получи PageRank изисква ресурси, които струват пари.

За да добиете представа за обемите – ето графика, която онагледява как расте интернет във времето, за да достигне до 1,88 милиарда сайта:

Ако в началото Google е обхождал и индексирал повече страници, то с времето Google започва да отсява качествената информация, за да влага ресурсите си в качествено, надеждно и авторитетно съдържание.

Как е дадено името на алгоритъма PageRank?

Етимологията на израза „PageRank“ също е интересна и си заслужава да бъде спомената. За Rank или „ранг“ в смисъла на „величина“ или „степен на значение“ е ясно, тъй като алгоритъмът оценява страниците и им присвоява степен на значимост.

А „Page“ – в превод на български „страница“, има двояк смисъл в „PageRank. От една страна се асоциира с буквалното си значение „страница“. Но от друга се свързва с фамилията на Лари Пейдж (Larry Page), който е съосновател на проекта.

Как работи PageRank на Google и какво оценява?

Вече уточнихме, че PageRank е сложен алгоритъм с множество математически функции. Но какви изходни данни използва, за да изчисли оценката на страниците?

PageRank калкулира броя и качеството на връзките към дадена страница, за да направи оценка колко авторитетен е сайтът. В основата на алгоритъма е заложена тезата, че колкото повече сайтове сочат към дадена страница, толкова по-важна и значима е тя.

Математическият PageRank за проста мрежа се изразява в проценти – Google използват логаритмична скала.

Във времето PageRank еволюира и към момента не е единственият алгоритъм за класиране на сайтове от Google. Но е първият алгоритъм, използван от Google и разбира се най-известният. От 24 септември 2019 г. PageRank и всички свързани патенти са изтекли.

Защо PageRank оценява връзките към даден сайт, за да го класира?

Тук за мен е най-интересната част историята. Всичко тръгва от проекта Google Books, който имал за цел да дигитализира множество книги с възможност за търсене в съдържанието им и безплатен достъп.

За целта Google сключват договори с много издатели. Паралелно стартира програмата Library Partners – за сканиране на десетки милиони книги от големи библиотеки по цял свят с индексиране на целия текст, за да може да е търси в него. 

Над 12 милиона издания са сканирани и индексирани от Google, а над 2 милиона от тях са от библиотеката на Станфордския университет. Общо около 30 библиотеки от целия свят се присъединяват към проекта.

Станфордският университет (заедно с Мичиганския университет, Харвардския университет, Oxford University Press и Нюйоркската обществена библиотека) са сред първите, които подкрепят проекта Google Library Project – част от Google Books за дигитализиране, търсене и индексиране на печатни книги. 

И какво общо има Google Books с Google Search и PageRank?

Тези, които са посещавали библиотека в миналото, вероятно си спомнят, че имаше едни картончета в картотека. Имаше подредба по автори по азбучен ред, а също и по тематика – категории.

За всяка книга бе посочен автор, заглавие, категория, кратко описание, къде се намира (индекс) – звучи ли Ви познато и правите ли съответната асоциация със сайтовете сега. Тази организация или логика на картотекиране е пренесена, копирана и дигитализирана от Google.

А какво общо имат връзките ли? Това са препратките от книгата към други автори и издания, които са използвани при нейното писане. Ако аз сега използвам за източник библиотеката на Станфордския университет, редно е да го посоча, а тя в случая получава връзка от мен.

Така беше едно време и при книгите, ако си спомняте – вмъкнатите цитати с посочване на източника, а сега е условие и за работа в научните среди, публикуване на научни трудове, където дори се изисква позоваване на определен брой авторитетни източници.

Колкото повече други сайтове посочват Вашия сайт, като източник на дадена информация, толкова повече са сигналите, че той е авторитетен и надежден. Колкото по-авторитетни са сайтовете, които Ви гласуват доверие, толкова повече расте силата на Вашия сайт.

Разбира се, винаги има начини за шикалкавене и манипулиране и от Google търсят способи за противодействие. Известна е търговията с линкове и хакването на сайтове, за да се влагат изходящи линкове без собственикът да подозира.


Тази история ми бе споделена в една SEO група, за да се ориентирам как работят търсачките и каква е философията на SEO – оптимизирането на сайтовете за търсещите машини – или какво да направим, за да класираме сайта си на първо място в Google.

Вашият коментар