Doar urmați toți pașii articolului și învățați multe lucruri noi și utile pentru dvs.!
Pasul 1 - Pregătirea
Pentru a începe, trebuie să descărcați o copie a librăriei de domenii simple HTML. Descărcarea este gratuită.
DESCĂRCAȚI DOM HTML simplu
În arhivă veți găsi mai multe fișiere, dar avem nevoie doar de o singură - simple_html_dom.php. Toate celelalte sunt exemple și documentație.
Pasul 2 - Elementele de bază ale parsingului HTML
Această bibliotecă este foarte ușor de folosit, dar totuși, trebuie să înțelegeți câteva dintre elementele de bază înainte să o utilizați.
Obținerea accesului la obiectele HTML DOM
Să presupunem că avem deja un obiect DOM, structura, ca în imaginea de mai sus. Puteți începe să lucrați cu aceasta folosind metoda find () și creând colecții. Colecțiile sunt grupuri de obiecte, găsite folosind selectori - sintaxa este oarecum similară cu jQuery.
Folosind acest exemplu de cod HTML, învățăm cum să accesăm informațiile conținute în al doilea paragraf (p). De asemenea, vom schimba informațiile primite și vom afișa rezultatul pe afișaj.
După cum puteți vedea, implementarea parsarea în PHP a unui document HTML este foarte simplă, utilizând o bibliotecă HTML simplu DOM. În principiu, în această bucată de cod PHP, totul poate fi înțeles intuitiv, dar dacă vă îndoiți de ceva, vom examina codul.
Linia 2-4. conectăm biblioteca, creăm un obiect de clasă și încărcăm codul HTML din șir.
Linia 7: Folosind această linie găsim totul
etichete din codul HTML și salvați o variabilă ca matrice. Primul paragraf va avea un index de 0, restul paragrafelor vor fi indexate 1,2,3 ...
Linia 10: Avem conținutul al doilea paragraf din colecția noastră. Indicele său va fi 1. De asemenea, modificăm textul utilizând atributul text interior. Atributul innertext, modifică tot conținutul din eticheta specificată. De asemenea, putem schimba eticheta în sine cu ajutorul atributului exterior.
Să adăugăm încă o linie de cod PHP, cu care vom aloca o clasă de stil paragrafului nostru.
Rezultatul executării codului nostru va fi următorul document HTML:
Mai jos sunt alte exemple de selectori. Dacă ați folosit jQuery, atunci în biblioteca simplă html dom sintaxa este ușor similară.
Biblioteca documentație simplu HTML DOM
Dați-vă doar o ilustrație care arată posibilele proprietăți ale elementului HTML DOM selectat.
Pasul 3 - Un exemplu real de parsare PHP a unui document HTML
Pasul 4 - Scrieți funcția principală a PHP parser HTML
Mai întâi, numim matricea noastră globală, pe care am specificat-o mai devreme. Creați un nou obiect simple_html_dom. Apoi, încărcați pagina pe care o vom analiza.
Pasul 5 - Găsiți informațiile de care aveți nevoie
În această bucată de cod, totul este extrem de simplu, găsim toate div cu class = nume_material. Apoi, citiți colecția de elemente și selectați numele materialelor. Toate materialele vor fi stocate în matrice în această formă:
Pasul 6 - Rezultatul rezultatului analizei
Pentru început, vom instala câteva stiluri pentru frumusețea informațiilor de ieșire obținute în timpul parsării.
Apoi, folosind câteva linii de cod PHP, vom afișa informațiile.
Rezultatul acestui script va fi o listă cu titlurile articolelor de pe site-ul sitear.ru.
concluzie
Deci am învățat php parsarea documentelor html. Amintiți-vă că parsarea este un proces lung. O pagină poate fi analizată aproximativ o secundă. Dacă parcurgeți un număr mare de documente HTML, serverul dvs. poate întrerupe funcționarea scriptului din cauza expirării timpului alocat pentru execuție. Aceasta poate fi corectată utilizând funcția set_time_limit (240); 240 este timpul în secunde pentru ca scriptul să ruleze.
Hole în com_content
Trateazăm un virus pe un site
Inspecția inițială a site-ului a constatat că clientul a restricționat accesul la FTP, ceea ce a redus gama de vulnerabilități suspectate, astfel încât a existat o deschidere într-un fel de motor de script Joomla. Kaspersky Yar.
Troj / JSRedir-MH
Din nou, a fost un tunet de tunet de site-uri de către un nou virus Troj / JSRedir-MH. Și așa, pe scurt, virusul Troj / JSRedir-MH. Un virus sau un troian este mult mai interesant decât predecesorii săi, acum.
Actualizarea extensiei pentru adresa de e-mail JK
Astăzi, voi împărți câteva informații interesante pentru proprietarii de site-uri colectate de John. Mai devreme sau mai târziu, este sarcina de a subscrie și de a trimite informații de pe site, poate fi o altă setare a problemei.
Bună, adică 10 regulat
Kunena înlocui linkul cu profilul utilizatorului
Salut, din nou, din nou, cunen, a primit o sarcină pentru a termina forumul popular Kunena, astăzi a fost necesar să se schimbe legătura cu profilul utilizatorului. Acest lucru se datorează faptului că site-ul este social.
Lucrează pe Kunena - de ce în fiecare pagină?
Kunena scapă de citare inutilă
Pentru cei care fac într-adevăr un site pentru oameni, următoarea mea notă. Îți voi spune cum să scapi de cotații suplimentare în postările de pe forumul kunena. Am câteva site-uri tematice cu o vizită normală.
Procesarea parametrilor extensiei Joomla
Atunci când dezvoltați extensii pentru Joomla CMS, cum ar fi plug-in-uri, module, componente sau șabloane, devine adesea necesară obținerea parametrilor unei extensii dezvoltate sau a oricărei alte extensii. În asta.
Modelul Kunena se prăbușește
1. În folderul \ components \ com_kunena \ template \ your_pattern \, găsim fișierul template.xml și inserați o piesă (astfel încât să puteți selecta dacă doriți să afișați acest câmp sau nu):