Cum funcționează Google ca motor de căutare, algoritmi de căutare în 2018

Serviciile pe care le utilizați pentru a căuta, cum ar fi Google, Yahoo și Bing, sunt numite motoare de căutare. Numele în sine sugerează că cererea de informații se realizează pe un imens pagini web de baze de date (index). Din acest motiv, puteți găsi tot ceea ce conține cuvintele pe care le căutați. acum 20 de ani, motoarele de căutare funcționează într-adevăr în acest fel. Pagini treptat „soluționa“ în cod, care face un conținut de pagini web disponibile la textul de căutare.

Deoarece proliferarea Web, Acum, căutarea este foarte frecvente pentru a găsi un cuvânt sau o frază, respectiv, la un număr tot mai mare de pagini. Oamenii nu le place pentru a defila prin liste lungi cu rezultatele manual, în scopul de a găsi paginile dorite care se potrivesc cel mai bine nevoilor. De exemplu, o căutare pe cuvântul „ușă“ (ușă) în limba engleză Google, de exemplu, oferă mai mult de 1,9 miliarde de rezultate. Nepractic - dacă nu imposibil - pentru a vedea toate rezultatele pentru a găsi cele mai relevante pagini.

Valorile PageRank a lucrat atât de bine încât au schimbat complet modul în care utilizatorii interacționează cu rezultatele căutării. Deoarece PageRank oferă cele mai relevante rezultate din partea de sus a paginii, utilizatorii au început să acorde mai puțină atenție ceva mai jos. Pagini care nu apar pe pagina de rezultate, de fapt, devin „invizibile“: utilizatorii au încetat să le viziteze.

Pentru distracție, încercați să se familiarizeze cu „navigarea pe web invizibil“: du-te la Google și să încerce să caute mai departe decât prima pagină a rezultatelor căutării. Porțiuni mici de utilizatori au fost vreodată dincolo de prima pagină, iar Google nici măcar nu se deranjează să afișeze toate 1,9 miliarde de rezultate de căutare pentru „ușă“. În schimb, lista se oprește la 63 de pagini.

Editorii și site-uri comerciale care concurează pentru a obține în vârfurile de rezultate ale căutării, dat naștere la o nouă afacere: optimizarea motorului de căutare (sau SEO). Există mai multe metode diferite de SEO, dar scopul principal al jocului este faptul că algoritmul PageRank lucrează în favoarea ta prin creșterea numărului de link-uri primite la pagina, si tuning textul ancora. Cu site-uri concurente pentru vizitatori - și miliarde de venituri în cauză - PageRank-ul a pierdut în cele din urmă „cursa înarmărilor“. Astăzi, textul ancora de link-uri nu definește cele mai relevante rezultate, și, în consecință, importanța valorilor PageRank scăzut.

Motoarele de căutare sunt lăsate în mod constant în direcția mașinii de învățare pentru a clasifica rezultatele. In fiecare an, folosit de 1,2 trilioane de căutări în Google - este aproximativ 3 miliarde de $ pe zi și 40.000 pe secundă. Fiecare interogare de căutare devine parte dintr-un flux foarte mare de cereri, iar căutătorul simultan „vede“ tot ceea ce miliarde de oameni sunt în căutarea în întreaga lume. Pentru fiecare intrare de interogare oferă o gamă largă de rezultate și Google aduce aminte care dintre ele este cel mai important. Apoi, motorul de căutare utilizează rezultatele anterioare pentru a afla ce este cel mai important pentru „mediu“ utilizator, pentru a oferi cele mai relevante rezultate în viitor.

Motoarele de căutare pot satisface 90% sau solicită acest lucru, folosind termenii de căutare anterioare și rezultatele. Motorul de căutare nu mai este în căutarea pe Internet, în cele mai multe cazuri. În loc de rezultate de căutare în index este rezultatul mai preferat al utilizatorilor anteriori.

Această schimbare a PageRank-ul la masina de învățare a schimbat, de asemenea, rol în acest proces. Fără a Căutările și, respectiv, rezultatele de prelevare - un motor de căutare nu ar fi capabil să învețe și să asigure viitorul rezultatelor pentru alți utilizatori. De fiecare dată când utilizați un motor de căutare, sistemul utilizează pentru a clasifica rezultatele, și pe o scară masivă. Acesta te face cel mai valoros activ.

Andreas Gal (Andreas Gal) - Chief Technology Officer la Mozilla. El este cunoscut a fi implicat în mai multe proiecte open source.

articole similare