Să ne uităm la un parser gratuit pentru distribuția GScraper. Parserul este cel mai bun de acest fel datorită vitezei mari de parsare, abilității de a configura parserul pentru diverse nevoi și, bineînțeles, gratuit.
După pornirea parserul vom vedea trei file «Proxy», «Opțiuni» și «Razuiti», în care puteți specifica setările corespunzătoare (introduceți lista de proxy, setați timpul de expirare, numărul maxim de fire, specificați fișierul pentru a exporta rezultatele parsare, obține URL-ul titluri sparsennyh etc. .d.). Lăsați aceste setări în mod prestabilit. Nu vom folosi proxy-ul. Cu o parsare lungă fără proxy, bineînțeles că nu poți să faci, deci dacă faci o mulțime de parsare și un magazin lung de lucru proxy.
Să luăm un exemplu de site-uri rare construite pe motorul DLE pentru înregistrarea ulterioară pe ele.
Du-te la fila «Razuiti» și introduceți semnele DLE și parsarea de cuvinte cheie: Footprint (e) - «index.php do = înregistrați?», Cuvinte cheie - „Înregistrare“. Faceți clic pe "Porniți răsturnarea"
După cum puteți vedea, în 13 secunde, parserul a găsit 739 de adrese URL. Acum, să clarificăm rezultatele duplicatelor, trebuie să eliminăm domeniile duplicate. Pentru aceasta, selectați "Eliminați domeniul duplicat" și faceți clic pe "Faceți". Ca rezultat, sunt 385 de site-uri rămase. Acum, în același mod în care definim site-urile rămase de PR, numărul de pagini din indexul Google, și titlurile de pagină, selectând opțiunea corespunzătoare și apăsând «Do».
După cum puteți vedea, unele site-uri din emisiune nu sunt site-uri DLE, de exemplu, puteți vedea forumul Avast. Acest lucru se datorează faptului că, pe pagina forumului, cel mai probabil, sunt discutate semnele DLE și printre acestea "index.php? Do = register". Prin urmare, dacă doriți să utilizați site-uri DLE, este mai bine să utilizați această interogare: "inurl:" index.php? Do = lostpassword "password".
Acum puteți salva rezultatele (numai linkurile sau toate coloanele).
Puteți descărca GScraper offline din acest link sau de pe Yandex Disk.
Există, de asemenea, o versiune plătită a parserului cu mai multe opțiuni (de exemplu, folosind un proxy cu un program offsite), care în prezent costă 68 $.