Un model de date este o abstracție care, atunci când este aplicată unor date specifice, le permite utilizatorilor și dezvoltatorilor să le trateze ca informații, adică informații care conțin nu numai date, ci și relația dintre ele. În Fig. 2 prezintă clasificarea modelelor de date.
Fig. 2. Clasificarea modelelor de date
În plus față de cele trei niveluri de abstractizare luate în considerare, există încă un strat în proiectarea bazei de date care le precede. Modelul acestui nivel ar trebui să exprime informații despre domeniu într-o formă care să fie independentă de DBMS-ul utilizat. Aceste modele sunt numite Infological, sau semantică, și reflectă într-o formă naturală de utilizatori și convenabil pentru dezvoltatorii și alte informații de nivel logic de abstractizare asociate cu fixare și descrierea obiectelor de domeniu, proprietățile lor și relațiile lor.
Modelele de date infologice sunt folosite în etapele inițiale de proiectare pentru a descrie structurile de date în procesul de dezvoltare a unei aplicații, iar modelele de date sunt deja suportate de un DBMS specific.
Modelele de date documentare corespund noțiunii de informații slab structurate, orientate în principal către formate libere de documente, texte în limbaj natural.
Modelele bazate pe limbile de marcare a documentelor sunt în primul rând legate de limbajul standard de markup comun - SGML (Standard Generalized Markup Language), care a fost aprobat de ISO ca standard în anii 1980. Această limbă este creată pentru a crea alte limbi de marcare, definește un set valid de etichete (linkuri), atributele acestora și structura internă a documentului. Controlul asupra corectitudinii utilizării etichetelor se realizează utilizând un set special de reguli, numite descrieri DTD. care sunt utilizate de programul client atunci când parsarea documentului. Pentru fiecare clasă de documente definește propriul set de reguli care descriu gramatica limbajului de markup corespunzător. Utilizând SGML, puteți descrie datele structurate, puteți organiza informațiile conținute în documente, puteți prezenta aceste informații într-un format standardizat. Dar, din cauza complexității sale, SGML a fost folosit în principal pentru a descrie sintaxa altor limbi (cea mai cunoscută fiind HTML), iar câteva aplicații au lucrat direct cu documentele SGML.
Mult mai simplu și mai convenabil decât SGML, limbajul HTML vă permite să definiți designul elementelor de document și aveți un anumit set limitat de instrucțiuni - etichete, cu care se realizează procesul de marcare. Exemplele HTML sunt destinate în primul rând pentru a controla procesul de afișare a conținutului unui document pe ecranul unui program client și, astfel, a determina modul în care documentul este prezentat, dar nu structura acestuia. Ca element al bazei de date hipertext descrise de HTML. Se utilizează un fișier text care poate fi ușor transferat prin rețea utilizând protocolul HTTP. Această caracteristică, precum și faptul că HTML este un standard deschis, iar numărul mare de utilizatori are capacitatea de a utiliza posibilitățile de această limbă pentru înregistrarea documentelor, desigur, a influențat creșterea popularității HTML și a făcut astăzi mecanismul principal pentru furnizarea de informații de pe Internet.
Cu toate acestea, HTML astăzi nu satisface pe deplin cerințele stabilite de dezvoltatorii moderni pentru limbile de acest fel. Și a fost înlocuit de o nouă limbă de marcare hipertext, puternică, flexibilă și, în același timp, un limbaj convenabil XML. Care sunt avantajele sale?
XML (Extensible Markup Language) - un limbaj de marcare care descrie o clasă de obiecte de date numite XML-dokumsntami. Acesta este utilizat ca un mijloc de a descrie gramatica altor limbi și controlul asupra corectitudinii redactării. Aceasta este în sine XML nu conține etichete destinate unui marcaj, acesta definește pur și simplu ordinea creării lor.
Modelele Thesaurus se bazează pe principiul dicționarelor de organizare conțin anumite constructe lingvistice și principiile cooperării lor într-o anumită gramatică. Aceste modele sunt utilizate în mod eficient în traducătorii de sisteme, în special în cazul traducătorilor multilingvi. Principiul de stocare a informațiilor în aceste sisteme este supus modelelor tezaurului.
Modelele descriptorilor sunt cele mai simple dintre modelele documentare, fiind utilizate pe scară largă în primele etape ale utilizării bazelor de date documentare. În aceste modele, fiecare descriptor descriptor corespundea fiecărui document. Acest descriptor a avut o structură rigidă și a descris documentul în conformitate cu caracteristicile necesare pentru lucrul cu documentele din baza de date documentară elaborată. De exemplu, pentru o bază de date care conține descrierea brevetului, acesta cuprinde un câmp de nume de mâner, la care brevetul, numărul de brevete, data eliberării brevetului și un număr de parametri-cheie, care sunt umplute pentru fiecare brevet. Prelucrarea informațiilor în astfel de baze de date a fost efectuată exclusiv de descriptori, adică de parametrii care caracterizează brevetul, și nu de textul brevetului propriu-zis.
Datele stocate în baza de date au o anumită structură logică - cu alte cuvinte, ele sunt descrise de un model de reprezentare a datelor (model de date) sprijinit de DBMS. Următoarele modele de date sunt clasificate ca fiind clasice:
În plus, în ultimii ani, au apărut următoarele modele de date și au devenit mai activ implementate în practică:
De asemenea, sunt dezvoltate diverse sisteme bazate pe alte modele de date care extind modelele cunoscute. Acestea includ modele obiect-relaționale, deductive-orientate pe obiecte, semantice, conceptuale și orientate. Unele dintre aceste modele servesc la integrarea bazelor de date, bazelor de cunoștințe și limbajelor de programare.
Unele DBMS suportă simultan mai multe modele de date. De exemplu, în INTERBASE pentru aplicații, se folosește limba de rețea a manipulării datelor, iar în interfața cu utilizatorul sunt implementate SQL și QBE.