Arhivele moderne - software

Ce arhive există și cum diferă acestea?

Este necesar să se facă distincția între programul real-archiver, formatul de arhivă și metodele de compresie. Chiar aceeași metodă de comprimare poate avea opțiuni de implementare. De exemplu, există mai mult de o duzină de programe de arhivare care pot crea arhive ZIP. În schimb, datele în format ZIP pot fi comprimate prin diferite metode: Deflate, Deflate64, BZip2. Metoda Deflate are mai multe implementări cu diferite viteze și compresiune (diferența este de aproximativ 5%). Cu această metodă, arhivatorul 7-zip vă permite să creați arhive ZIP și 7Z.

De obicei, arhiverele pot crea arhive în propriul format exclusiv folosind metodele lor originale. De exemplu, arhivatorul RAR vă permite să creați arhive RAR. Formatele de arhivă și metodele de comprimare sunt principalele avantaje ale unui arhivator.

În cel mai simplu caz, arhivatorul vă permite să împachetați sau să dezarhivați doar un fișier. În plus față de compresia efectivă a datelor, arhiverele moderne oferă câteva funcții suplimentare. Există câteva tipuri de bază:

  • comprimarea unor fișiere și a directoarelor întregi;
  • crearea arhivelor de auto-extragere (SFX). Adică, pentru a despacheta programul de arhivare, arhivatorul nu este necesar;
  • modificați conținutul arhivei;
  • criptarea conținutului arhivei;
  • informații pentru restaurarea arhivei cu daune parțiale și posibilitatea restaurării arhivelor deteriorate;
  • defalcarea arhivei în mai multe părți sau volume;
  • consolă versiune a programului pentru a lucra de la linia de comandă;
  • Versiune grafică (GUI) a programului.

Este demn de remarcat faptul că, în ciuda disponibilității formale, implementarea fiecărei funcții suplimentare poate fi realizată la un nivel complet diferit.

Pe lângă diferențele de funcționalitate, puteți împărți arhivele în două grupuri: asimetrice și simetrice. Filtrele asimetrice necesită mult mai puțin timp și RAM pentru operațiunea de despachetare decât pentru operațiunea de ambalare. Acest lucru vă permite să obțineți rapid conținutul arhivei pe computerele cu consum redus de energie. Arhivele simetrice necesită același timp și cantitate de RAM pentru operațiile de ambalare și despachetare. Utilizarea unor astfel de arhive pe o gamă largă de computere sau pentru accesul rapid la conținutul arhivei este limitată. Un cunoscut arhivar RAR ca principal utilizează o metodă de comprimare a dicționarului asimetric, iar pentru texte se poate folosi o metodă PPM simetrică. Astfel, arhivarea RAR comprimată cu raportul maxim de compresie poate să nu fie posibilă pe computerele cu o cantitate limitată de RAM. Toți sau aproape toți arhivarii avansați cu un raport de compresie ridicat sunt simetrici.

Nu am statistici exacte privind prevalența arhivarilor. Voi exprima punctul meu de vedere subiectiv pe baza experienței personale. Desigur, cel mai comun arhivator este ZIP și modificările acestuia. Prin prevalența sa, aceasta depășește cu mult concurenții cei mai apropiați. Vine RAR și ACE. În ultimii ani, există un arhivator 7-zip. Nu am întâlnit personal alte arhive și arhive. Excepția este o dată popular ARJ și LHA. În prezent, acestea nu sunt relevante din cauza raportului foarte redus de compresie.

Testarea raportului maxim de compresie

În acest test, obiectivul principal a fost acela de a determina cel mai bun arhivator prin raportul de compresie. Rata de compresie a fost secundară.

Pentru o varietate de teste și identificarea punctelor forte și a punctelor slabe, s-au folosit mai multe seturi de date care necesită diferite abordări și metode pentru o bună compresie. Dimensiunea lor este aleasă suficient de mare, astfel încât arhiverele cu o mărime mare a dictionarului sau mai eficient folosind memoria RAM să poată demonstra avantajul lor. Comprimate cu ajutorul ZIP-ului, acestea ocupă o dimensiune de aproximativ 15 MB.

Pentru fiecare set de date, este de obicei posibil să selectați parametrii cei mai optimi de compresie. Cu toate acestea, în acest test, pentru toate seturile de date, s-au utilizat parametri și metode unice, oferind o medie a celor mai bune rezultate bazate pe 512 MB de RAM. Această abordare este un compromis. Pe de o parte, puteți evalua eficiența diferitelor tipuri de date, deși unii arhivatori nu vor afișa raportul maxim de compresie. Pe de altă parte, în realitate trebuie să comprimați dosare întregi cu diverse date, iar valorile specifice ale parametrilor pot afecta atât pozitiv cât și negativ compresia datelor ca întreg. În plus, alegerea parametrilor optimi nu este atât de simplă, durează mult și este rareori efectuată în viața reală.

Este important să subliniem faptul că alegerea datelor sursă afectează în mare măsură rezultatele testului. De exemplu, folosind datele de tip text (TXT, HTML, DOC, LOG) și multimedia (WAV), arhivatorul 7-zip (LZMA) va afișa rezultate mai slabe decât RAR, care are metode speciale pentru astfel de tipuri de date. Utilizarea datelor incompresibile (JPG, PDF) va arăta o mică diferență între arhivele cu raport de compresie slab și bun. Apropo, multe fișiere pot conține atât informații comprimabile, cât și informații necomprimate. Includerea fișierelor în format DOC și PDF.

O influență puternică se exercită prin selectarea parametrilor optimi de compresie. De exemplu, în conformitate cu www.maximumcompression.com, care utilizează parametrii optimi de compresie pentru fiecare set de date, diferența dintre 7-zip și RAR este de aproximativ 3%, ceea ce este mult mai mic decât diferența obținută în acest test.

Testarea a fost efectuată pe sistem: procesorul - Athlon XP 2800+, RAM - 512 MB.

Fișiere text. Fișiere text în format HTML în limba rusă (16,5 MB), coduri sursă în limbile de programare JAVA, Delphi, Python (24,8 MB). Dimensiunea fișierului de la 20 MB.

Sub arhivar se înțelege programul-arhivator, formatul arhivei și metoda de compresie în complex. Textul de mai jos utilizează caractere cursive pentru a evidenția această colecție.

Deoarece nu toate arhivele testate susțin abilitatea de a comprima dosare, pentru ele setul de date a fost anterior transformat într-o arhivă ZIP cu un raport de compresie zero.

Arhivorul lui Slim un pic. De fapt, acest arhivator bun poate comprima dosare întregi, dar nu utilizează modul de compresie continuă. Ca rezultat, pe setul de testare txt el a arătat un rezultat relativ slab. Dacă utilizați arhivă ZIP cu raport de compresie zero, atunci pe compresie seturile exe și med, raportul de compresie sa dovedit a fi mult mai rău. Acest lucru se datorează faptului că arhivatorul Slim folosește metode speciale pentru anumite formate de fișiere. Arhiva ZIP, deși conține fișiere necomprimate, este pentru Slim numai ca arhivă ZIP. Astfel, pentru arhivatorul Slim, testarea txt și bak a fost pre-convertită într-o arhivă ZIP cu un raport de compresie zero.

  1. Modul continuu nu este acceptat. Arhivatorul nu este eficient atunci când comprimați un număr mare de fișiere mici.
  2. Arhivatorul cu 7 zipuri nu acceptă crearea de arhive ZIP de auto-extragere (SFX). Cu toate acestea, această posibilitate este disponibilă în multe alte arhive care pot crea arhive ZIP.
  3. Arhivatorul WinRK nu are o versiune separată a consolei, dar există o oportunitate de a lucra cu arhivatorul din linia de comandă.
  4. Arhiverul WinUDA are o versiune de consolă, dar utilizează o metodă de compresie mai veche și creează arhive incompatibile cu versiunea grafică (GUI).
  5. Arhivatorul UHARC nu are o versiune separată cu o coajă grafică. Cu toate acestea, există o carcasă WinUHA terță parte complet funcțională.
  6. Principala metodă de comprimare a arhivatorului RAR este metoda dicționar asimetrică. Cu toate acestea, cu compresia maximă, se poate utiliza și utiliza o metodă simetrică pentru comprimarea textului (PPM).
  7. Dacă setați detectarea automată a memoriei RAM pentru comprimarea textului, atunci datele de testare și sistemul de testare pentru arhivatorul RAR au necesitat numai 64 MB, iar raportul de compresie sa deteriorat ușor.
  8. Cele mai multe arhive necesită RAM semnificativ mai puțin pentru a crea arhive ZIP.

Pagina 1: Introducere, metode de comprimare, caracteristici de date

Pagina 2: Care sunt arhiverele și cum sunt ele diferite?

St.3: Rezultate, rezultate

Articole similare