Suntem atât de obișnuiți cu Internet și la faptul că scrierea cuvântul corect într-un motor de căutare pot găsi orice informații pe care le iau de la sine. Cu toate acestea, în urmă cu câteva două decenii, se poate face numai cu mâinile, se alăture biblioteca chestionate o grămadă de dicționare și enciclopedii. Cum motoarele de căutare pe Internet găsi toate aceste informații într-o fracțiune de secundă? În cazul în care l-au utilizat deloc? Acestea și alte aspecte abordate în mod direct în acest articol.
Desigur, există mai multe motoare de căutare, deoarece acestea nu spun unul de Google. Printre ei este plin de motoarele de căutare bine-cunoscute: Yandex, Microsoft Bing, Yahoo, Duck Duck Go, și, desigur, Sputnik. Cu toate acestea, principiile generale ale lucrării în care sunt identice, deci să se ocupe de ei. Dar, în primul rând, un pic de istorie.
Un pic de istorie
În curând o serie de alte motoare de căutare concurente. In unele privinte au concurat cu directoarele populare pe Internet, cum ar fi «Yahoo!». Dar căutare directorul capacitatea de a restricționa căutarea de către directorul în sine, mai degrabă decât textul din paginile Web. directoarele mai târziu sunt îmbinate și furnizate de către motoarele de căutare pentru a îmbunătăți căutarea.
Repere de lucru motor de căutare
Cele trei procese-cheie care permit motorul de căutare pentru a da interogările de căutare cele mai relevante rezultate sunt după cum urmează:
scanda
Scanarea - un proces în care roboții descoperă pagini noi și actualizate pentru a fi adăugate la baza de date. Motorul utilizează un număr foarte mare de computere pentru a prelua (sau „crawl“) miliarde de pagini de pe Internet.
Programul, care face proba, cunoscut ca un robot, bot, sau păianjen (deoarece funcționează pe web). Bot utilizează un proces algoritmică: programe de calculator determină site-urile să acceseze cu crawlere, și cât de des, cât de multe pagini sunt indexate de pe fiecare site.
Site-urile noi devin în cele din urmă statutul existent, „mort“ (de exemplu, care nu duce nicăieri) sunt detectate link-uri, iar datele sunt utilizate pentru a actualiza indexul (baza de date). Din punct de vedere comercial pe Google, de exemplu, de bord pentru a scana site-ul cuiva de multe ori nu sunt acceptate: ei preferă să păstreze serviciul de căutare separat de serviciile lor de venit AdWords.
indexare
Indexarea - robot de prelucrare fiecare dintre paginile pe care este vorba, în scopul de a crea baze de date masive de toate cuvintele pe care le recunoaște și localizarea cuvintelor de pe fiecare pagină. În plus, motorul de căutare procesează informațiile situate în etichetele și atributele cheie, cum ar fi etichete de titlu și atributele ALT.
Procesarea începe într-un moment când un utilizator introduce o solicitare de căutare, apoi motorul de căutare vine în baza sa de date (index) pentru selectarea paginilor de căutare cele mai relevante și returnează rezultatele care sunt cele mai relevante pentru utilizatori.
Pentru a se asigura că site-ul a avut un loc bun în pagina cu rezultatele căutării, motorul de căutare ar trebui să continue dreptul neverificată și să acceseze cu crawlere și să indexeze site-ului. Multe motoare de căutare oferă servicii speciale pentru a ajuta webmasteri vă poate ajuta să evite capcanele comune și de a îmbunătăți clasarea site-ului.
Motoarele de căutare în Rusia și în lume
Potrivit diverselor grupuri de cercetare, puteți face următoarele concluzii interesante cu privire la balanța de instrumente de căutare de alimentare de pe piață:
Salutări de la Yandex de la zero