Obțineți pagini din forumul pentru motoarele de căutare Google pentru webmasteri

Ne cerem scuze pentru orice neplăcere.

dar solicitarea dvs. este similară cu cererile trimise automat
virus de computer sau software rău intenționat. Pentru a
protecția utilizatorilor noștri, nu vă putem procesa solicitarea
imediat.

Vom restabili accesul dvs. în cel mai scurt timp, așa că repetați
După ceva timp. Pentru moment, dacă credeți că dvs.
computer sau rețea locală pot fi infectate, atunci puteți rula
aplicație pentru scanarea pentru viruși sau pentru eliminarea programelor spyware
programe pentru a vă asigura că computerele dvs. nu sunt infectate cu viruși sau
malware-ului.

Dacă pagina cu această eroare este deschisă în mod constant în browser, atunci
Problema poate fi rezolvată prin ștergerea cookie-urilor Google și accesarea acestui site.
site-ul din nou. Instrucțiunile pentru un anumit tip de browser pot fi
Accesați centrul de asistență al browserului dvs. pe Internet.

Dacă este afectată întreaga rețea, pot exista informații suplimentare
căutați în Centrul de ajutor Google Web Search.

Ne cerem scuze pentru inconveniente și sperăm că în curând
Veți folosi din nou site-ul Google.


IseeDeadPeople
United Electric

Din păcate, nu există un astfel de instrument care ar analiza Google fără a obține interdicția privind IP-ul. Acesta este motivul pentru care bretonul de scurtă durată pentru parsare și referința frecventă la acesta. Trebuie să folosim parsile cu suport pentru proxy-uri. Și încă mai trebuie să facă stocuri.


dar, în general, este posibil și astfel să rezolve problema
de exemplu, un proxy / suc, pisica google nu cunoaște și parsează prin ea. încet. cu intervale, - desigur, această mașină este deja plină

și cât mai curând HANA, apoi un alt proxy și de asemenea.

dar, în general, verific uneori site-urile mele pe Google.
și, uneori, în seara, mi-a dat deja cai doar cu captcha.

Căpitanul Keen a scris:

Masca solicită companiei Google solicitările unui surfer obișnuit și veți fi fericit.


Și smochinele acolo - chiar dacă introduci cereri manual în browser, interzice același lucru, prin 70-80 de cereri (tocmai încercat)


de exemplu, un proxy / suc, pisica google nu cunoaște și parsează prin ea. încet. cu intervale, - desigur, această mașină este deja plină


De asemenea, nu ajută prea mult. Dacă setați intervalul dintre cererile pe minut (+ variați aleatoriu), banca vine în 5-6 ore și aproximativ 300 de solicitări.

Pe scurt, am rezolvat problema forței proaste brutal - am cumpărat un serviciu proxy de la awmproxy și încărcat automat lista la fiecare 10 minute. Viteza nu este atât de caldă, dar pentru câteva săptămâni ar trebui să se descarce.

Mistere, tu de la calculatoarele locale Google. Apoi îmi iau cuvintele. Am vorbit despre parserii serverului.

Lena. multumesc pentru link-uri. Ele au doar un răspuns la întrebarea TS.


Rețineți - "sistemul nostru înregistrează cereri automate". Faceți acest lucru astfel încât să nu vă înregistrați automat, să vă deghizați ca oameni și totul va fi bine. Cu un parser obișnuit, nu va exista nicio interdicție.

Dacă Google aruncă alertele pe browsere reale, atunci pentru oricare dintre imitațiile lor și chiar mai mult - aceasta este ideea principală.


Pentru a simula browserul - da, simularea utilizatorului mediu - nr.
Luați-o și încercați să scrieți pentru o parte din site-ul dvs. un sistem de protecție împotriva parsării automate. În același timp, unul care cel puțin întrerupe utilizatorii de încredere - veți înțelege imediat multe dintre principiile acestei protecții și vulnerabilitatea acesteia.

Lucrăm cu parteneri de mult timp pentru a analiza mai multe resurse. Din când în când, unul dintre noi vine cu un alt "sistem ingenios anti-spider, care nu se rupe". Sarcina celorlalți este să o rupă. Ei bine, aici ne distrăm. În același timp, abilitățile cresc.

Orice site public este un sistem informatic deschis, este chiar teoretic imposibil de a face 100% protejat de parsare. Orice (!) Site-ul public poate fi analizat automat, întrebarea este doar în resursele necesare pentru aceasta. Aici economia vine pe primul loc. Într-adevăr, uneori, în loc să scrie, să depanem și să rulați scripturi, este mai profitabil să angajăm indieni care "dau" resursa. Dar Google nu aparține numărului de astfel de resurse.

Nu sunteți prima persoană care se gândește să trimită Google antetele HTTP corecte.


Da, nu am spus că am inventat-o. Despre parsarea cărții este locul unde este descrisă lucrarea cu http-headers. Apropo, este scris că nu poate fi trecut doar agentul de utilizator al liniei
În plus, înțeleg diferența dintre o idee și implementarea ei. Comunismul, să zicem, o idee uluită și orice implementare a acesteia este un rahat trist. Dacă nu aveam scenarii reale care să analizeze Google fără o interdicție, nu aș spune că sunt posibile.