Atunci când se utilizează HTML, datele afișate nu sunt legate în mod logic de tagurile utilizate pentru marcare, astfel încât parserii nu pot utiliza etichete pentru a găsi fragmentele necesare ale documentului. În plus, setul limitat de etichete HTML face dificilă utilizarea pentru a afișa informații de specialitate (de exemplu, formule matematice).
Limba XML atrage o atenție deosebită dezvoltatorilor și utilizatorilor de internet. Există noi limbi create pe baza XML, există servere Web care utilizează această tehnologie pentru a organiza informațiile stocate pe ele. Specificațiile complete ale limbilor XML și a limbilor asociate sunt disponibile pe pagina oficială W3C - www.w3.org
HTML este o versiune simplificată a limbajului markup SGML. Mult mai simplu și mai convenabil decât SGML, limbajul HTML vă permite să definiți designul elementelor de document și aveți un anumit set limitat de instrucțiuni - etichete prin care se realizează procesul de marcare. Instrucțiunile HTML sunt destinate, în primul rând, să controleze procesul de afișare a conținutului unui document pe ecranul unui program client și, astfel, să determine modul în care documentul este prezentat, dar nu structura acestuia. Ca parte a bazei de date hipertext descrisă de HTML, se folosește un fișier text care poate fi ușor transferat prin rețea utilizând protocolul HTTP. Această caracteristică, precum și faptul că HTML este un standard deschis și un număr foarte mare de utilizatori are capacitatea de a utiliza posibilitățile de această limbă pentru înregistrarea documentelor, desigur, a influențat creșterea popularității HTML și a făcut-o astăzi principalul mecanism pentru furnizarea de informații de pe web
Cu toate acestea, aplicațiile moderne nu au nevoie doar de un limbaj de reprezentare a datelor pe ecranul clientului, ci și de un mecanism care permite definirea structurii unui document, pentru a descrie elementele conținute în acesta. HTML are un set simplu de comenzi și gestionează cu succes sarcina de a descrie informațiile hipertext afișate de ecranul browserului. Cu toate acestea, datele afișate în sine nu sunt asociate cu acele etichete care sunt utilizate pentru formatare, astfel încât instrumentele de analizor nu au capacitatea de a utiliza etichete HTML pentru a găsi fragmentele documentului de care avem nevoie. Ie întâlnind, de exemplu, o astfel de descriere
Un alt dezavantaj semnificativ al HTML este setul limitat de etichete. Regulile DTD pentru HTML definesc un set fix de descriptori și, prin urmare, dezvoltatorul nu are capacitatea de a introduce etichete proprii, speciale.
Rezumând tot ceea ce sa spus, se poate argumenta că HTML nu satisface pe deplin cerințele elaborate de dezvoltatori pentru limbile de acest fel. HTML completează limbajul XML de marcare a hipertextului, un limbaj puternic, flexibil și convenabil. Care este demnitatea lui?
Termenul XML reprezintă un tip special de document hipertext. Ce este atât de rău în legătură cu documentele text obișnuite și ce este special despre documentele XML?
De fapt, XML este o metodă de marcare a documentelor concepută pentru a forma o structură în documente și pentru a determina relațiile dintre diferitele elemente ale acestei structuri. Pentru a crea o astfel de marcare, există instrucțiuni speciale numite etichete. Etichetele sunt plasate între caractere <и>. Datorită disponibilității etichetelor, prelucrarea automată unificată și formatarea documentelor XML devin posibile. Datorită XML, este de asemenea posibil să se monitorizeze corectitudinea datelor stocate în documente și să se stabilească un singur standard pentru structura documentelor în care pot fi conținute date arbitrare. XML este indispensabil în construcția unor sisteme complexe de informații, în care problema schimbului de informații între diverși consumatori este foarte importantă. Cu XML, puteți să eliminați multe dintre problemele asociate cu incompatibilitățile folosite de diferitele componente.
Un exemplu de document XML tipic
Liniile rămase au o structură ierarhică clar exprimată, în care există o etichetă rădăcină
Rămâne doar să spunem ce semnifică înregistrările și ce pentru, cum ar fi type = "datetime" sau type = "string" în interiorul denumirilor de etichete
XML este un limbaj de markup care descrie o întreagă clasă de obiecte de date numite documente XML. Această limbă este folosită ca un mijloc de a descrie gramatica altor limbi și de a controla corectitudinea compilației documentelor. Ie XML în sine nu conține etichete destinate marcării, ci determină pur și simplu ordinea creării lor. Astfel, dacă, de exemplu, credem că pentru a indica elementul de trandafir într-un document, trebuie să utilizați eticheta
Un set de etichete poate fi ușor extins. Dacă, să zicem, ne-ar dori, de asemenea, să subliniem faptul că floarea descriere trebuie, în sensul de a merge în descrierea seră, în cazul în care infloreste, apoi cere doar noile etichete, și să aleagă ordinea în care acestea:
Dacă vrem să planificăm mai multe flori, ar trebui să facem următoarele schimbări:
Un alt avantaj evident al XML este abilitatea de ao folosi ca limbă de interogare universală pentru magazinele de informații. Astăzi, în adâncurile W3C este versiunea de lucru a standardului XML-QL (sau XQL), care poate avea o concurență serioasă pentru SQL va face în viitor. În plus, documentele XML pot acționa ca un mod unic de stocare a datelor, care include și instrumente pentru parsarea informațiilor și prezentarea acestora pe partea clientului. În această zonă una din direcțiile de perspectivă este Java integrare si XML - tehnologia vă permite să utilizați puterea ambelor tehnologii în construcția unei aplicații mașini independente, folosind, în plus, un format de date universală atunci când fac schimb de informații.
De asemenea, XML vă permite să monitorizați corectitudinea datelor stocate în documente, să verificați relațiile ierarhice din cadrul documentului și să stabiliți un singur standard pentru structura documentelor, conținutul cărora poate fi o varietate de date. Aceasta înseamnă că poate fi utilizat pentru a construi sisteme complexe de informare în care problema schimbului de informații între diferite aplicații care rulează pe același sistem este foarte importantă. Prin crearea structurii mecanismului de schimb de informații la începutul lucrului la proiect, managerul se poate salva în viitor din multe probleme asociate cu incompatibilitatea formatelor de date utilizate de diferitele componente ale sistemului.
De asemenea, unul dintre avantajele XML este faptul că programele de procesare a documentelor XML nu sunt complexe și astăzi toate tipurile de produse software proiectate pentru a lucra cu documente XML sunt distribuite în mod liber. XML este suportat astăzi în Microsoft Internet Explorer 4/0 și în versiunile beta ale IE5. A fost anunțată în versiunile viitoare ale aplicației Netscape Communicator, DBMS Oracle, DB-2, în aplicațiile MS-Office. Toate acestea sugerează că, cel mai probabil, în viitorul apropiat, XML va deveni limba principală a schimbului de informații pentru sistemele informatice, înlocuind, prin urmare, HTML. Bazate pe XML deja create astfel de bine-cunoscute limbaje de markup specializate, cum ar fi SMIL, CDF, MathML, XSL, precum și o listă de proiecte de lucru pentru limbi noi, în așteptarea W3C, este actualizată în mod constant.