Four Dots
Four Dots Blog

NAJNOVIJE
sa bloga

Google-ov Hummingbird algoritam nedavno je usvojio nešto što se čini prirodnom nadgradnjom na njegovu funkcionalnost, nešto što je skoro pa doslovce oličeno u sistemu za mašinsko učenje koji nazivamo RankBrain.

Čini se da se ovaj sistem oslanja na thought vectors i njihovu sposobnost da stvore vezu između entiteta na osnovu obimnih skupova analiziranih podataka. Tipično za Google – sve informacije iz prve ruke o tome kako sistem ustvari funkcioniše samo su stidljivo prošaputane kroz enigmatski osmeh Sfinge, prepuštajući nama samima da dešifrujemo i povežemo krhotine onih činjenica koje nam je napola predstavio.

Kako RankBrain Upotpunjuje Hummingbird

Deni Salivan iz SearchEngineLand-a, koji je vodio email prepisku sa Google-om na ovu temu, kaže da je cilj RankBrain-a da pomogne algoritmima da bolje razumeju nameru koja stoji iza korisničkih upita, kako bi u skladu sa njom dostavljali rezultate. Ono što nas zbunjuje je kako se to tačno RankBrain razlikuje od onoga što Hummingbird već radi.

Na primer, kada pokušava da otkrije namere korisnika, Hummingbird se znatno oslanja na kontekst i implicitne signale. Takođe, kao jedan od načina da odredi koje tačno značenje reči je relevantno za određeni upit, obraća pažnju na reči koje se često javljaju zajedno. U kombinaciji sa pristupom zasnovanim na entitetima i bazama podataka tripleta, on omogućava algoritmu da sve lako poveže i predloži najrelevantnije rezultate.

Pa ipak, problem sa ovim pristupom je to što se umnogome oslanja na ono što čovek unese kao upit. Naime, ljudi su ti koji unose semantičke oznake, skupove tripleta, liste sinonima i tako dalje. Osnovna ideja RankBrain-a je da eliminiše (ili da budemo realističniji, da smanji) potrebu za ljudskim unosom i tako dozvoli algoritmu da samostalno poveća svoju bazu podataka.

Uzimajući u obzir činjenicu da pretraživač obrađuje tri milijarde pretraga na dnevnom nivou, od kojih se sa 15% nikada ranije nije susreo, automatizovati prikupljanje podataka potrebnih za „razumevanje“ ovih pretraga čini se kao jedini način da se održi korak sa zahtevima.

Do sada je RankBrain učio offline, analizirajući ogromne skupove upita koji su postavljani tokom godina, rezultate koji su prikazivani i reakcije ljudi koji su unosili te upite. Oslanjajući se na Word2vec, prolazi kroz ogromne baze podataka sa sadržajem koji je dobio, prevodeći reči u vektore, što mu omogućava da stvara veze između entiteta i poboljšava razumevanje namera korisnika. Naravno, zahvaljujuću Google-ovoj tajnovitoj i lakonskoj prirodi, sve ovo je i dalje čisto nagađanje.

Dosadašnji Uticaj

Kako navodi Google, RankBrain postepeno izlazi u javnost još od početka 2015. godine i uticao je na značajan procenat upita koji su od tada postavljani. To je najspecifičnije što su voljni da podele sa nama.

Kako bi nas još više zbunio, Google ne samo da izbegava da nazove RankBrain ažuriranjem algoritma, tvrdeći da je samo signal za rangiranje, nego izbegava i da kaže da je postao treći najuticajniji signal za rangiranje. Ova izjava potiče direktno od Grega Korada, Google-ovog starijeg istraživača koji kaže da se ovo dogodilo u prvih nekoliko meseci od kako je RankBrain aktiviran.

Kako ne znamo koja su prva dva signala, ova izjava se čini nesebično specifičnom. Ukoliko vam to išta znači, Korado tvrdi da bi isključivanje ove funkcije po korisnike moglo da bude isto toliko štetno kao i kad bi im neko „uskratio pristup polovini stranica na Wikipediji“. O RankBrain-u možete više pročitati ovde.