Căutați în World Wide Web

Internetul este cea mai democratică sursă de informație. Toată lumea își poate pune propriile resurse pe web și își poate exprima opinia. Aceasta este, în același timp, forța și slăbiciunea World Wide Web.

Ar fi foarte dificil să găsești informații pe Internet dacă nu s-au creat instrumente de căutare puternice: motoarele de căutare (motoarele de căutare), catalogul (rubricatorii), link-urile tematice. enciclopedii online și dicționare.

Pentru a găsi diferite tipuri de informații, cele mai eficiente sunt diferitele instrumente.

Catalogul are o structură ierarhică. Secțiunile tematice din primul nivel definesc teme cât mai largi, cum ar fi "sport", "agrement", "știință", "magazine" etc. În fiecare astfel de secțiune pot exista subsecțiuni. Utilizatorul poate specifica zona de interes, călătorește prin arborele de catalog și îngustând treptat zona de căutare. De exemplu, când căutați informații despre laptopuri, lanțul de căutare poate arăta astfel: Tehnologia informației -> Calculatoare -> Notebookuri. După ce a ajuns la subdirectorul dorit, utilizatorul găsește un set de linkuri în el.

De obicei, într-un director toate link-urile sunt de profil, deoarece compilarea de directoare nu se face prin programe, ci de către oameni. Evident, dacă căutați informații generale despre un subiect larg, vă recomandăm să consultați catalogul. Dacă este necesar să găsiți un document specific, catalogul va fi un instrument de căutare ineficient.

Adesea, cataloagele de resurse sunt de asemenea ratinguri, adică catalogul oferă site-urilor înregistrate în acesta să stabilească pe paginile contorului de vizite. și afișează liste de link-uri către site-uri în funcție de popularitatea lor (participarea). Popularitatea resursei este estimată de un număr de parametri, inclusiv așa-numitele gazde (numărul de vizitatori unici pe zi) și hit-uri (numărul de vizite pe site pe zi).

Evident, procentul de documente relevante obținute depinde de capacitatea de a emite o cerere competent. Proporția documentelor relevante din lista tuturor celor găsite de motorul de căutare se numește precizia căutării. Documentele irelevante se numesc zgomot. Dacă toate documentele găsite sunt relevante (fără zgomot), atunci precizia căutării este de 100%. Dacă se găsesc toate documentele relevante, caracterul complet al căutării este de 100%.

Astfel, calitatea căutării este determinată de doi parametri interdependenți: exactitatea și caracterul complet al căutării. Creșterea gradului de exhaustivitate a căutării reduce precizia și viceversa.

Motoarele de căutare pot fi comparate cu un birou de help, al cărui agenți ocolește întreprinderile, culegând informații într-o bază de date. Când contactați serviciul, informațiile sunt furnizate din această bază de date. Datele din baza de date sunt învechite, astfel încât agenții le actualizează periodic. Cu alte cuvinte, serviciul de ajutor are două funcții: 1) crearea și actualizarea constantă a datelor din baza de date și 2) căutarea informațiilor în baza de date la cererea clientului.

De asemenea, un motor de căutare constă din două părți: așa-numitul robot de căutare (sau spider) care ocolește serverele rețelei și formează o bază de date și un mecanism de căutare a referințelor relevante pentru solicitarea utilizatorului în baza de date.

Trebuie remarcat faptul că, prin procesarea unei cereri specifice de utilizator, motorul de căutare funcționează cu o bază de date internă (și nu se deplasează pe Web). În ciuda faptului că baza de date a motorului de căutare este actualizată constant, motorul de căutare nu poate indexa toate documentele web: numărul lor este prea mare. Problema lipsei de completare a căutării constă nu numai în resursele limitate ale resurselor motorului de căutare, ci și în faptul că viteza robotului este limitată, iar numărul de noi documente web crește în mod constant.

Cele mai populare motoare de căutare de astăzi sunt Google (www.google.com, www.google.ru) și Yandex (www.yandex.ru).

Enciclopedii online și cărți de referință

În unele cazuri, este necesar să se găsească nu doar un document care conține un cuvânt cheie, și anume interpretarea unui cuvânt. Când căutați un termen necunoscut cu un motor de căutare, riscați să obțineți o serie întreagă de articole în care este folosit acest termen și încă nu știți ce înseamnă toate acestea. O astfel de căutare este preferabilă în enciclopedia online.

Istoricul World Wide Web

În anul 1989. care lucrează în CERN în cadrul rețelei interne a organizației, Tim Berners-Lee a propus un proiect hipertext global, acum cunoscut sub numele de World Wide Web.

Ca parte a proiectului, Berners-Lee a scris primul server web din lume și primul browser web de hipertext din lume, numit "WorldWideWeb".

Și totuși, baza teoretică a internetului a fost pusă mult mai devreme. În 1945, Vanniver Bush a dezvoltat conceptul de "Memex" - instrumente auxiliare pentru "extinderea memoriei umane". Memex este un dispozitiv în care o persoană își stochează toate cărțile și înregistrările sale (în mod ideal și toate cunoștințele sale care sunt supuse unei descrieri formale) și care oferă informațiile necesare cu suficientă viteză și flexibilitate. Bush a prezis, de asemenea, o indexare cuprinzătoare a textelor și a resurselor multimedia cu abilitatea de a găsi rapid informațiile necesare. Următorul pas semnificativ pe calea spre World Wide Web a fost crearea de hipertext (termenul a fost introdus de Ted Nelson în 1965).

Fig. 75. Logo-ul consorțiului World Wide Web

În prezent, computerele au o participare destul de limitată la formarea și prelucrarea informațiilor pe Internet. Funcțiile calculatoarelor sunt reduse în principal la stocarea, afișarea și extragerea informațiilor. În același timp, crearea de informații, evaluarea, clasificarea și actualizarea - toate acestea sunt încă efectuate de o persoană. Cum se pornește computerul în aceste procese? Dacă computerul nu poate fi încă învățat să înțeleagă limba umană, atunci este necesar să folosiți o limbă care să fie înțeleasă de calculator. Adică, într-o variantă ideală, toate informațiile de pe Internet ar trebui plasate în două limbi: în limba umană pentru persoana respectivă și în limba computerului pentru înțelegerea calculatorului. Webul semantic este conceptul unei rețele în care fiecare resursă în limba umană va fi furnizată cu o descriere pe care o înțelege computerul.

Programele vor putea găsi resursele necesare pentru ele însele, vor procesa informații, vor clasifica datele, vor identifica legături logice, vor trage concluzii și vor lua decizii pe baza acestor concluzii. Distribuția pe scară largă și implementarea inteligentă a web-ului semantic pot provoca o revoluție în Internet.

1. Prima rețea globală de calculatoare a avut un nume:

2. Furnizorul de Internet este:

un furnizor de servicii Internet;
o organizație implicată în crearea de site-uri web;
un dispozitiv periferic pentru comunicarea cu alt computer.

5. În ce dintre zonele de domeniu de prim nivel enumerate poate fi achiziționat un nume de domeniu de către o persoană juridică înregistrată pe teritoriul Federației Ruse?

8. Ce este HTML?

Unul dintre protocoalele familiei TCP / IP;
Limba de marcare Hypertext a documentului;
Limba de programare.

Articole similare

Pagina anterioară

Pagina următoare