GZIP vs BZIP2
GNU zip (også kjent som GZIP) er et program med formål å komprimere filer. Det var opprinnelig ment å erstatte komprimeringsprogrammet som ble brukt i de tidlige Unix-systemene - for å bli brukt i GNU Project (et gratis programvareprosjekt).
BZIP2 er en åpen kildekode-lossless datakomprimeringsalgoritme - i utgangspunktet en klasse av datakomprimeringsalgoritmer som gjør det mulig for de opprinnelige dataene til en komprimert fil å bli fullstendig rekonstruert fra komprimerte data.
GZIP er basert på en algoritme kjent som DEFLATE. Dette er også en tapsløs datakomprimeringsalgoritme. Den bruker både LZ77-algoritmen og Huffman-kodingen. I hovedsak refererer GZIP til filformatet med samme navn. Dette formatet er en 10-byte header som inneholder et magisk nummer (som betyr en numerisk eller tekstverdi som aldri endres og brukes til å betegne et filformat eller en protokoll, en navngitt tallverdi som aldri endres eller forskjellige verdier som ikke kan forveksles for noe annet), ekstra overskrifter som kanskje eller ikke egentlig er nødvendige (f.eks. originalt filnavn), en kropp som inneholder en DEFLATE-komprimert nyttelast (som er dataene som overskriftene har) og en 8-byte bunntekst som inneholder et CRC-32 kontrollsum, samt den faktiske lengden på de originale ukomprimerte dataene.
Det finnes en rekke komprimeringsteknikker som BZIP2-formatet bruker, som stables oppå hverandre i flere lag. De forekommer i en svært særegen rekkefølge: Kjørlengdekoding (som er hvilken som helst sekvens av fire til 255 duplikat symboler som erstattes av de fire første symbolene, og en lengde av koding som gjentar mellom 0 og 251), Burrows-Wheeler transform som er den reversible blokk-sorteringen som utgjør selve kjernen i BZIP2), Flytt til forsiden (etterlater størrelsen på den behandlede blokk uendret), Kjørlengdekoding (som består av lange tråder av symboler - vanligvis nuller - som hele tiden gjenta i utgangen, og erstattes av både symbolet og en sekvens av to koder), Huffman-koding (som er en prosess som erstatter symboler med fast lengde på 8-bit byte med endring av lengdekoder), Multiple Hoffman-koding (som består av flere Hoffman-tabeller med samme størrelse), Unary base 1-koding, Delta-koding og Sparse bit array.
Sammendrag:
1. GZIP er et gratis program som brukes til å komprimere filer; BZIP2 er en åpen kildekode-lossless datakomprimeringsalgoritme som gjør det mulig å hente de opprinnelige dataene i en komprimert fil.
2. GZIP består av en 10-byte header, valgfrie overskrifter, en kropp og en 8-byte bunntekst; BZIP2 består av ikke mindre enn ni lag kompresjonsteknikker.