Արխիվացնողները ծրագրեր են, որոնք կարող են սեղմել տեղեկատվությունը ֆայլերում: Modernամանակակից արխիվացնողները թույլ են տալիս մի քանի ֆայլեր միավորել մեկ արխիվում և դիտել այդպիսի արխիվների բովանդակությունը: Նրանց օգնությամբ ստեղծված արխիվի չափը, պարզվում է, շատ ավելի փոքր է, քան բուն ֆայլի չափը:
Հրահանգներ
Քայլ 1
Արխիվացողների մեծ մասի գործունեության ընդհանուր սկզբունքը հիմնված է ալգորիթմի վրա, որը մշակվել է հետազոտողներ Ա. Լամպելի և Z. Ivիվի կողմից անցյալ դարի 80-ականներին: Ziv- ի և Lampel- ի կողմից ստեղծված ալգորիթմը թույլ է տալիս հաշվարկել կրկնօրինակ ծածկագիրը ֆայլում և այդպիսով նվազեցնել դրա չափը: Դրա համար բառարանը կազմվում է տվյալների հաջորդականություններից: Օրինակ, ֆայլի երկուական ծածկագիրը պարունակում է հետևյալ համադրությունը. 10111011101110110011. Հեշտ է տեսնել, որ 1011 կոդը դրա մեջ մի քանի անգամ է կրկնվում: Արխիվացնողը հայտնաբերում է այդպիսի ծածկագիրը և միայն մեկ անգամ գրում այն արխիվին, իսկ ապամոնտաժելուց հետո այն կրկին փոխարինում է ծածկագրին ֆայլի անհրաժեշտ վայրերում:
Քայլ 2
Որքանով է արխիվացնողը սեղմելու ֆայլը, կախված է աղբյուրի բառարանի չափից: Եթե բառարանը չափազանց մեծ է, դա կանդրադառնա արխիվի չափի վրա: Եթե բառարանի չափը չափազանց փոքր է, ստեղծված արխիվում կարող են սխալներ առաջանալ: Դուք կարող եք բարձրացնել ֆայլի սեղմման գործակիցը `օգտագործելով entropy կոդավորումը (այսպես կոչված Huffman մեթոդը): Entropy կոդավորմամբ կրկնվող երկուական կտորները գրվում են կարճ կոդի միջոցով: Archամանակակից արխիվացողների մեջ էնդրոպիայի կոդավորումը օգտագործվում է որպես ծածկագրման լրացուցիչ մեթոդ:
Քայլ 3
Unix համակարգերի վրա gzip- ը ամենատարածված արխիվացնողն է: Այս արխիվացնողը տվյալների կորուստը սեղմում է և հիմնված է Deflate ալգորիթմի վրա: Ֆայլերի սեղմումն այստեղ տեղի է ունենում երկու մոտեցմամբ. Նախ `կրկնօրինակվում են կոդի կտորները, իսկ հետո դրանցում գտնվող նիշերը փոխարինվում են նոր նիշերով` օգտագործելով Huffman մեթոդը: Unix համակարգերի արխիվացնողները մի շարք թերություններ ունեն: Դրանք հիմնականում ուղղված են արխիվներին, որոնք բաղկացած են բազմաթիվ ֆայլերից, ուստի մեկ ֆայլ հանելը դժվար է: Դա պայմանավորված է նրանով, որ Unix արխիվացնողները արխիվը դիտում են որպես դրանում փաթեթավորված բոլոր ֆայլերի շարունակական զանգված: Արխիվը կազմվում է յուրաքանչյուր ֆայլում պարունակվող տեղեկատվության հիման վրա:
Քայլ 4
Windows համակարգերում տարածված են այնպիսի արխիվացնողներ, ինչպիսիք են WinZip, 7-zip և WinRAR: Ի տարբերություն Unix համակարգերի, այս արխիվացնողները կենտրոնացած են ինչպես անհատական ֆայլերի, այնպես էլ բազմաթիվ ֆայլերից բաղկացած շարունակական արխիվների վրա աշխատելու վրա: Windows- ի ժամանակակից արխիվացնողներից շատերը «հասկանում են» արխիվի շատ ձևաչափեր, աջակցում են կոդավորմանը և ունակ են սեղմել շատ մեծ ֆայլեր (օրինակ, WinRAR արխիվացնող ֆայլի առավելագույն չափը ավելի քան ութ միլիարդ գիգաբայթ է):