Pentru a vă familiariza cu principalele motoare de căutare pe Internet. Master abilitățile de lucrări în motoarele de căutare. Aflați cum să alegeți motorul de căutare optim, luând în considerare specificul sarcinilor.
Ce sunt motoarele de căutare? Care sunt părțile principale ale pachetului software?
Motoarele de căutare reprezintă un set de programe speciale pentru căutarea pe web.
Principalele părți ale pachetului software:
1. Păianjen roșu (păianjen). Un program autonom care se repetă prin paginile site-urilor care sunt în coada de indexare. Descărcă conținutul paginilor pe discul motorului de căutare.
2. Crawler-ul Robot (păianjen "călătorește"). Sarcina sa este de a colecta toate link-urile de pe pagina cercetată, de a găsi altele necunoscute sistemului de căutare și de a le adăuga în lista indexurilor de așteptare.
3.Indeksator. Procesează paginile din coadă pentru indexare. Pentru aceasta compilează un "dicționar" al paginii, își amintește "frecvența" folosirii cuvintelor. În special notează cuvintele cheie utilizate în titluri, subliniate în text cu caractere aldine. Puneți toate acestea într-un fișier special - "index".
4. Baza de date. Stochează legături către pagini, un dicționar de cuvinte găsit pe pagină și multe alte informații necesare pentru formarea rezultatelor căutării.
5. Sistemul de procesare a cererilor și de emitere a rezultatelor. Acceptă solicitarea utilizatorului, formează o interogare în baza de date, primește rezultatul de acolo și îl transmite utilizatorului.
Ce sunt directoarele? Prezentați avantajele și dezavantajele acestora
Cataloagele reprezintă un mijloc tradițional de organizare a informațiilor. Probabil, toți trebuiau să ne întâlnim cu cataloage de bibliotecă, cu cataloage de mărfuri. Cataloagele sunt utilizate într-o varietate de sisteme. Aproape oriunde, unde trebuie să stocați și să organizați informații.
Dezavantajele directoarelor includ următoarele:
În primul rând, ambiguitatea structurii - este o clar minus organizația informații în catalog (deși oarecum atenuată de faptul că fiecare director de căutare majore este implementat în catalog).
În al doilea rând, oamenii fac directoare. Completitudinea și calitatea acestora depind de numărul și calificările persoanelor implicate în lucrul în catalog, de gusturile și preferințele personale. Neuniformitatea umplerii rubricilor este o caracteristică caracteristică a tuturor cataloagelor.
În al treilea rând, laboriositatea rubricii manuale limitează volumul de informații catalogate.
În același timp avantajul incontestabil de directoare este faptul că informațiile stocate în ea ordonate, în conformitate cu logica umană de bază și relevanța pagini găsite în catalogul de căutare este de obicei mult mai mare decât atunci când caută motoarele de căutare.
După cum sa menționat mai sus, deoarece directoarele sunt create manual, acestea acoperă mult mai puține resurse decât motoarele de căutare. În web astăzi, potrivit unor estimări prudente, există miliarde de pagini (și numărul lor este în creștere de zi cu zi per milion). Majoritatea motoarelor de căutare nu s-au apropiat de indexarea întregii rețele. Excepția este Google (pentru www.google.ru din Rusia), care susține că este pe această cifră - un miliard de pagini, acoperite parțial sau integral de indici. Cel mai mare director - Open Directory Project (www.dmoz.org) - În acest context, se pare mică: a înregistrat doar aproximativ 2 milioane de pagini în ea ..
Ne-am aștepta ca, deoarece Proiectul Open Directory va fi creat de voluntari, calitatea rezultatelor va fluctua. Dar, ca rezultat, obținem liste bine organizate de pagini relevante cu descrieri clare ale fiecărui link. Iar site-ul Open Directory Project produce aceeași impresie ca Google: este o "căutare curată" fără distragere a atenției, cum ar fi legăturile către magazine.
Ce catalog să alegeți, toate au un avantaj față de motoarele de căutare: ele pot fi vizualizate sistematic folosind un sistem de meniuri ierarhic.