În ultimul articol am considerat programe pentru parsarea site-urilor. Mai multe detalii despre parsarea site-urilor: ce este și pentru ce este necesar, puteți citi aici.
Destul de ciudat, dar interesul în parsarea site-uri recent foarte velik.Ono și nu în mod surprinzător, nu toată lumea este în măsură să se ocupe de text în mod corespunzător recruta nefericitului executa-l și să comunice cititorului.
În acest articol, vom continua să analizăm programele de analiză a site-urilor relevante.
UniParse este un parser gratuit de conținut rapid și url cu capacitatea de a configura filtrarea.
caracteristici:
- texte de pe site-uri
- parsarea de pe orice site fără gunoi este configurată
- parsit url al paginilor.
Atunci când îl utilizați, parserul url poate declanșa un răspuns de la furnizorul dvs. de găzduire și vă poate bloca IP-ul.
Configurarea parserului de conținut Uni Parse
Exemplu de setări pentru analizatorul de conținut Uni Parse
Modificatorul [-cleantext] conținut interpretor spune că din piesele rezultate trebuie să elimine toate formatarea textului și tot gunoiul.
WP UniParser 3.0 este un parser universal. care poate parsa conținut de pe site-uri pe absolut orice CMS!
WP UniParser 3.0 este ușor de instalat și configurat. Parserul este instalat ca un plugin obișnuit WordPress. Pentru a sparge conținut de pe un site, trebuie doar să specificați limitele blocului de conținut și, de asemenea, să configurați regulile pentru traversarea "victimei".
De asemenea, merită menționat faptul că WP UniParser 3.0 poate planifica publicarea postărilor. Astfel, puteți da imediat un număr imens de înregistrări care vor fi publicate treptat pe blogul dvs. pentru o perioadă lungă de timp.
Și în sfârșit - funcția de auto-traducere a conținutului prin intermediul serviciului Google Traducere. Acesta permite utilizatorului să specifice limba în care să traducă conținutul sparried înainte de a adăuga la blog. Implicit, plug-in-ul afișează cele mai populare limbi (rusă, engleză, germană, franceză, ucraineană etc.), dar dacă este necesar, dezvoltatorul, la cererea cumpărătorului, poate adăuga orice limbă care este prezentă în Google Translate.
Marele plus al produsului este disponibilitatea unei întrebări bine dezvoltate. Va fi util să se familiarizeze cu toți cumpărătorii viitori.
CUM SĂ FUNCȚIONEZĂ UNPARSER PLAIN DE WP ÎN BLOG AUTORIZAT PENTRU WORDPRESS
Deci, mergeți la zona de administrare a blogului dvs., apoi pe Setări. apoi WPUniParser.
Am setat toate setările în conformitate cu următoarele:
Specificați adresele URL din care să analizați conținutul (fiecare dintr-o linie nouă)
//kolchaka.net/
Alegeți limba din care doriți să traduceți
rusă
Selectați limba pentru a traduce
engleză
Puneți o întrebare despre continuarea parsării
MARCAT
Salvați imagini pe serverul dvs. (încetinește parserul)
ELIMINAT
Dimensiunea maximă a directorului de încărcări (KB)
Orice număr (dacă imaginile de pe serverul dvs. nu sunt salvate, această opțiune nu este relevantă)
Ieșiri de ieșire ale tuturor erorilor (cele critice sunt întotdeauna de ieșire) și de procesare (nu este recomandat pentru site-uri mari)
MARCAT
Paginile care nu permit restricționarea adreselor URL nu ar trebui să fie incluse în lista pentru analiză
ELIMINAT
Introduceți o expresie regulată pentru a găsi poziția inițială a culturii
/
/ i
Introduceți liniile care, dacă sunt găsite în URL, pagina este ignorată (fiecare cu o nouă linie) - OR logică
/ feed
/ încărcări /
/ categoria /
/ sitemap
/ contact
/ autor /
/ print /
/ căutare /
/ etichetă /
Introduceți liniile, atunci când este găsit în codul paginii, este ignorat (fiecare cu o linie nouă) - OR logică
PRELIMINARUL
Introduceți liniile, dintre care una trebuie să fie prezentă în URL, astfel încât pagina să fie procesată (fiecare cu o linie nouă) - OR logică
PRELIMINARUL
Introduceți liniile care trebuie să fie prezente în corpul paginii, astfel încât pagina să fie procesată (fiecare cu o nouă linie) - Și logica
Introduceți etichete care limitează titlul
Introduceți limitele de tăiere pentru tăiere
PRELIMINARUL
SEO (introducerea cuvintelor cheie în posturi)
PRELIMINARUL
Numărul minim de apariții ale unei chei
Orice număr (dacă câmpul SEO este gol, această setare nu este relevantă)
Numărul maxim de apariții ale unei chei
Orice număr (dacă câmpul SEO este gol, această setare nu este relevantă)
Iată cum arată panoul de administrare cu aceste setări:
Așteptăm fereastra cu întrebarea "Doriți să continuați procesarea paginilor prime? “.
Faceți clic pe OK. Următorul pas începe. Parsarea continuă. Numărul de pagini procesate de parser pe fiecare permis este setat în câmpul corespunzător:
IMPORTANT: Rețineți că numărul de pagini procesate pe fiecare pas poate să nu coincidă cu numărul de postări adăugate pe blogul nostru, deoarece unele pagini nu pot trece restricțiile definite de utilizator (despre ele mai jos).
Astfel, parserul va funcționa până când procesează toate paginile care se află în coada de procesare. Dacă nu doriți să continuați parsarea între pasaje, debifați "Întrebați întrebarea despre continuarea parsării".
Dar aici, parsarea se termină în cele din urmă. Acest lucru poate fi văzut din câmpurile de setări active. Acum, trageți bara de derulare în jos pentru a ajunge la buștenii parserului.
Jurnalul (implicit) are 4 secțiuni:
Mesaj de jurnal (parserul de mesaje log emise în ultima trecere);
Informații despre procesul de procesare (numărul total de pagini prelucrate, precum și paginile care nu au fost încă procesate);
Pagini procesate (într-un număr maxim de 200 de înregistrări) (adrese URL ale paginilor procesate. Un maxim de 200 este dat în jurnal).
Paginile care urmează a fi procesate (în maxim 200 de jurnale) Adresele URL ale paginilor care sunt în coada de procesare. Un maxim de 200 este dat în jurnal).
În exemplul curent, vedem că blocul "Pagini care trebuie procesate" nu conține nici o intrare. Acest lucru sa întâmplat deoarece WP UniParser scondrii toate paginile site-ului, care a avut loc pe un constrângeri definite de utilizator, iar în momentul în toate paginile de manipulare goale.
Acum puteți evalua rezultatele pluginului. Mergem la blog-ul nostru (pagina principală) și să vedem că am avut 5 posturi noi (în funcție de setarea „Cât de multe posturi de a publica dintr-o dată“).
Articole similare