Filtrare conținut și de căutare tematice - Ivan Begtin

Zrevshie mult timp în raționament, dar acum mai mult și împinge situația, îmi cer scuze pentru cuvântul murdar, cu „portal de școală.“

Întrebarea este cum să asigure filtrarea conținutului, oferind astfel o cantitate suficientă de informații.

Tehnologii și produse care creează o căutare pe lista albă:

Pentru aceeași „căutare școală“ ar putea fi oricare dintre aceste tehnologii cu același succes și un cost relativ scăzut.

2. Blocarea căutării după cuvinte cheie / fraze.

Metoda clasică care este utilizată, aceeași edu.gogo.ru, school.yandex.ru google.com și la filtrarea maximă.

O listă de cuvinte cheie cel mai des folosite pentru adulți și conținut obscen. Atunci când detectează că utilizatorul folosește un anumit cuvânt cheie sau o expresie, rezultatele căutării nu sunt afișate și a emis un rezultat neimprimate sau de avertizare de la filtru. Există unele distractiv ca limba română este foarte ambiguu și același cuvânt în diferite contexte poate fi atât abuzivă și destul de decente.

Este pe acest principiu trece prin bine-cunoscut-edu.gogo.ru căutare școală cu rezultate infamă și familie Yandex de căutare (family.yandex.ru) cu rezultate doar puțin mai bune.

O altă problemă de cuvinte cheie de blocare in mii lor si experimente, chiar simple, cum ar fi cele pe care am citat mai sus, le permite să se în jur. Ca să nu mai vorbim de faptul că mulți oameni folosesc argou, ca urmare a menținerii unei liste activă necesită blocare sau de operatori, sau „socializare“, cu implicarea vizitatorilor activi la selecția de cuvinte similare.

3. Blocați indexarea paginii cheie

Un astfel de mecanism de filtrare utilizat de Google și Yahoo în cazul în care puteți utiliza Căutarea sigură, dar, de exemplu, nu este utilizat în Yandex.

4. Dispozitiv de închidere conform etichete personalizate

5. Recunoașterea imaginii know-how

6. Indicii de curățare manuală și fraze cheie

Se spune că un Google relevanță ridicată este determinată nu numai algoritmi, dar și prezența multor operatori care sunt în mod constant extermină indicele de spam. Problema aici este costul unei astfel de muncă în volumul său, având în vedere miliarde de documente indexate.

Ca un rezumat. Eu cred că este necesar să se răspândească cele două concepte de „listă protejată“ și „căutarea Filtrată.“

Căutare Protejat - un conținut de blocare pentru adulți cu 99%

căutarea Filtrate - parțială și negarantat blocarea conținutului.

Deci, construirea unei căutări pot fi protejate numai atunci când se lucrează pe lista albă și nimic altceva. Toți ceilalți algoritmi de bloc poate îmbunătăți doar calitatea rezultatelor căutării curente.

Pe lângă filtrarea conținutului poate fi îmbunătățită după cum urmează:

1. compilație socializat de cuvinte-cheie pentru a fi incluse în lista de blocare. Puteți, cel puțin sub forma unei sociale separat. de rețea, puteți direct în interfața motorului de căutare. Pro-uri au ambele abordări. În cazul serviciilor sociale. Rețelele pot crea o listă generală de cuvinte blocate, iar diferite motoare de căutare sunt în măsură să alimenteze foile fluidizării interne din acesta, precum și de vot mai ușor și aprobare. În cazul interfeței motorului de căutare - pentru a face cuvântul blocat poate fiecare dintre utilizatorii săi, dar moderarea va fi loc pentru operatorul motorului de căutare.

2. Posibilitatea de a seta etichete personalizate în conjugat cu serviciul de căutare.

articole similare