Format fișier 2

Formatul fișierului. Formatul de date - structura caietul de sarcini date. înregistrate într-un fișier de calculator. Formatul de fișier este adesea menționată în numele său, ca parte a punctului detașat; de obicei, această parte se numește extensia de nume de fișier. deși, strict vorbind, acest lucru nu este adevărat [clarifica].

De exemplu, la sfârșitul numelui (extensia) «.txt» utilizat de obicei pentru a se referi la fișiere care conțin doar informații de text. un «.doc» - cu un conținut de text, structurate în conformitate cu standardele Microsoft Word. Fișierele care se potrivesc cu același format (cel puțin - o familie de formate), denumite uneori ca fișiere de același tip.

Deoarece comun în conceptul de calcul al unui fișier - secvență nestructurate de bytes. programe de calculator. păstrarea fișierelor de date structurate trebuie cumva să le transforme într-o secvență de octeți și invers (în OEP, aceste operațiuni sunt numite, respectiv, „serializarea“ și „deserializarea“, acesta din urmă este, de asemenea, cunoscut sub numele de „parsing“ sau „parsing“ pentru informații text). Algoritmul acestor schimbări, precum și un acord cu privire la modul în care diferitele tipuri de date structurate sunt situate în fișier, și constituie un „format“.

Diferite formate de fișiere pot fi diferite grade de detaliu, un singur format poate fi o „suprastructură“ pe celălalt, sau de a utiliza elemente de alte formate. De exemplu, un format de text impune doar restricțiile mai generale privind structura datelor. format HTML oferă îndrumări suplimentare despre fișierul dispozitiv intern, dar orice HTML-fișier este în același timp un fișier text.

Un alt exemplu - software-ul de structura în sine - fișierele executabile. ar trebui să se conformeze strict la unele așteptări, declanșând sistemul său de operare.

Uneori, companiile pot lua în considerare anumite formate de fișiere sale comerciale secrete și să nu le publice. Un exemplu bine-cunoscut - formatele de fișiere Microsoft Office. În unele cazuri, compania care a lansat cererea vede pur și simplu nu este nevoie să-și petreacă timp scriind specificații detaliate.

Determinarea tipului de fișier

Tip fișier - aceste informații pentru a identifica rapid conținutul sistemului de operare de fișiere, iar utilizatorul fără a fi nevoie de a citi întregul conținut al fișierului. Cu aceste informații utilizatorul știe despre tipul de informații conținute în sistemul de operare fișierul și poate fi comparat cu un program de prelucrare a acelui tip de fișier. Pentru a putea funcționa corect cu fișiere, programe trebuie să fie în măsură să determine tipul lor. Din motive istorice, abordări diferite pentru rezolvarea acestei probleme sunt folosite în diferite sisteme de operare.

extensie de nume de fișier

Unele sisteme de operare, de exemplu, CP / M. DOS. și Microsoft Windows utilizează pentru a determina tipul de numele fișierului. adică, „extensia de nume de fișier“. În sistemele de operare mai vechi, acestea au fost trei personaje separate de numele fișierului punct (FAT fișier numele de familie de sistem și de extensie sunt depozitate separat, punctele sunt adăugate deja la nivelul sistemului de operare); în sisteme mai noi extensie poate fi pur și simplu o parte a numelui, apoi numai lungimea numelui nefolosit este limitată la lungimea (care poate fi, de exemplu, 255 de caractere). De exemplu, HTML-fișiere pot potrivi extinderea «.htm» sau «.html».

Utilizatorul poate schimba în mod liber extensia de fișier. Deoarece mulți utilizatori, utilizați extensia shell pentru a determina programul cu care pentru a deschide fișierul, se poate face ultimul lucru inaccesibil sau chiar „pierde“ în cazul în care utilizatorul uită extensia originală. Prin urmare, Windows Explorer ascunde extensia implicită. Această practică are un dezavantaj: ca extensie de fișier nu este vizibil, puteți păcăli utilizatorul să creadă că, de exemplu, un fișier cu extensia .txt - imagine cu o extensie diferită. În același timp, un utilizator experimentat poate folosi posibilitatea de a schimba tipul de fișier destinație, pur și simplu prin schimbarea extensie pentru a deschide într-un alt program, nu-l îndreptat în mod direct. Acest lucru poate fi util în cazul în care programul nu prevede deschiderea fișierelor cu o anumită extensie, iar utilizatorul știe că formatul pentru prelucrare în cadrul acestui program.

numere Magic

O altă metodă care este utilizat pe scară largă în sistemele de operare UNIX -cum ar fi, trebuie să fie stocată în fișierul în sine un fel de „număr magic“ (semnătură) - o secvență de simboluri pe care pot fi identificate prin formatul de fișier. Inițial, termenul a fost folosit pentru un anumit set de identificatori de 2 octeți stocate la începutul fișierului (această practică a migrat la alte sisteme de operare, de exemplu, MZ la MS-DOS), cu toate acestea, orice secvență de caractere, tipice acestui format poate fi utilizat ca " număr magic. "

Aceasta este comanda de fișier pentru a stabili formatul de fișier, care utilizează fișierul / usr / share / misc / magie

Linie cu așa-numita „shebangami“ în fișiere script - un tip special de „numere magice“. Aici, semnătura - textul poate fi citit-uman care definește script-ul programului interpret.

metadate

Unele sisteme de fișiere vă permit să stocați atribute suplimentare pentru fiecare fișier, sau „metadate“. Aceste metadate pot fi folosite pentru a stoca informații despre tipul de fișier. Această abordare este folosită în computere Apple Macintosh. Metadatele sunt susținute de sisteme de fișiere moderne, cum ar fi HPFS. NTFS. ext2. ext3, și altele. Dezavantajul acestei metode este de toleranță slabă - atunci când copierea fișierelor între sisteme de fișiere de diferite tipuri de metadate pot fi pierdute.

Tipuri de date definite standardul MIME. utilizate pe scară largă într-o varietate de protocoale de rețea. Cu toate acestea, în sistemele de fișiere până când acestea sunt rareori folosite.

articole similare