Algoritm pentru captura captcha
Se crede că fișierele spam nu pot citi imaginea și pot lăsa acest câmp necompletat sau pot introduce un alt text. Nepotrivirea acestui câmp cu simboluri reale va servi pentru a nega acțiunea.
Dacă nu instalați o astfel de protecție, atunci o mulțime de roboți de spam vor zbura instantaneu către site și acolo va fi acolo unde puteți lăsa legături către alte site-uri. La randul lor, daca motoarele de cautare determina ca site-ul are un numar mare de link-uri necontrolate, atunci pot exclude site-ul din problema de cautare. Motoarele de căutare percep pozitiv numai legăturile naturale, prin urmare protecția împotriva spam-ului este necesară, chiar și cea mai elementară.
Hard Captcha
Există un număr mare de capturi diferite. Pentru ca o persoană obișnuită să recunoască captcha nu va fi foarte dificilă. Desigur, există captcha, în cazul în care totul este depășit, o grămadă de artefacte și nici o persoană nu va fi capabil să determine ceea ce este în spatele simbolurilor. Aceste captcha îi irită pe utilizatori.
Algoritm pentru captura captcha
Cred că toată lumea cunoaște programul Adobe FineReader, probabil că toată lumea a folosit-o sau cel puțin a văzut cum este folosit de alții. Acest program scanează textul din hârtie și îl recunoaște astfel încât să îl puteți edita cu ușurință în Word. Algoritmul de recunoaștere caută elemente grafice similare cu literele și le compară. Dacă documentul este clar și literele sunt vizibile clar, întregul document este ușor de recunoscut. Și dacă un document rău, întunecat, mototolită și conține „zgomot“, acesta nu este recunoscut sau detectat, astfel că, în loc de litere și cifre va fi un număr mare de caractere! „# $% ^ *. / @ [<>]
"Acest lucru va însemna că documentul este mai ușor de reimprimat manual decât să remediem toate aceste" prostii ".
În prezent, există o mulțime de captcha, rezistente la recunoașterea automată. Unul dintre ele este Yandex, deși există deja algoritmi care o pot recunoaște, dar nu încă foarte bine. Echipa Yandex a făcut chiar accesul API la Captcha, astfel încât oricine să-și poată instala protecția pe site-ul lor.
Cel mai bun algoritm pentru capturarea captcha
Până în prezent, surprinde cercetatorii de laborator a crea algoritmi complexe și inteligente, dar programatori foarte avansate utilizează pentru a recunoaște rețelele neuronale captcha până când toate sunt ocupați și de lucru, am să vă spun despre un „algoritm“, recunoașterea oricărui CAPTCHA - un serviciu antigate.com. Serviciul este simplu. Atunci când un robot de spam întâlnește o protecție sub forma unei captuse, îl otrăvește pur și simplu pentru recunoaștere în antigate.com.
Antigate.com este un serviciu excelent pentru recunoașterea oricărei captări. Serviciul a înregistrat milioane de oameni din întreaga lume care se află și recunosc manual toate capturile. roboți Spam trece în captcha antigate.com, îl afișează pe ecranul utilizatorului, și ei introduc caracterele, atunci răspunsul este trimis înapoi la un robot de spam. Puteți să vă gândiți mai întâi că aceasta este o perioadă foarte lungă de timp, însă, în medie, este nevoie de doar 15 secunde pentru a recunoaște o captură. În acest mod viclean, un robot de spam poate recunoaște aproape orice CAPTCHA.
În acest serviciu, un număr mare de persoane lucrează, în timp ce diviziunea muncitorilor pe țări este aproximativ următoarea:
- India, aproximativ 45%
- Vietnam, aproximativ 15%
- Pakistan, aproximativ 14%
- Ucraina, aproximativ 4%
- Rusia, aproximativ 3%
- și așa mai departe.
De asemenea, pe site există o demonstrație live a modului în care Captcha este recunoscută. Puteți vedea captcha curent și cine din ce țară determină, precum și rezultatul recunoașterii, simbolurile primite. De exemplu, puteți vedea captcha de la Yandex, care este recunoscut în medie în 5-8 secunde.
Informații utilizate în articol
Wow, se pare care ar fi algoritmul de distorsiune în Captcha nu a fost folosit, este încă recunoscut?
M-am așezat timp de 10-15 minute uitându-mă la demo-modul, cum recunosc captcha-ul. Și pentru acest moment a fost prins un captcha, pe care nu l-au recunoscut. A fost scrisă cu litere simple, fără nici o denaturare, numai culoarea era diferită, textul era după cum urmează: "Două sute șaptezeci și opt de mii șase sute optzeci și unu". Există o șansă crescândă ca un angajat din India sau Pakistan să nu poată înțelege ce se cere de la el.
Acum, pentru fiabilitate, este mai bine să utilizați captcha grafice, de exemplu, pentru a arăta trei imagini și a pune o întrebare, de exemplu, care este imaginea persoanei care rulează? Dar această metodă va fi fiabilă dacă creați un număr foarte mare de întrebări și imagini.