Descoperirea cunoştinţelor
/ Knowledge Discovery >> Descoperirea cunoştinţelor >> tech >> calculator >> program de calculator >>

Cum Fișier de compresie Works

t de fapt repetate împreună, ca expresia " " tara.; În acest caz, programul va suprascrie intrarea dicționarul pentru " ou " cu intrarea pentru ". țara ta "

Expresia " se poate face pentru " este, de asemenea, repetate, o dată urmată de " dvs. " și o dată, urmată de " te, " oferindu-ne un model repetat de " poate face pentru tine "., Acest lucru vă permite să ne scrieți 15 caractere (inclusiv spațiile), cu o valoare număr, în timp ce " tara " permite doar scrie-ne 13 de caractere (cu spații), cu o valoare număr, astfel încât programul să suprascrie " țara dumneavoastră " intrare ca doar " r țară, " și apoi scrie o intrare separată pentru " poate face pentru tine "., Programul continuă în acest fel, ridicarea toate biți repetate de informații și apoi calcularea care a modelelor ar trebui să scrie la dicționar. Această capacitate de a rescrie dicționarul este " " adaptive parte din LZ algoritm-Român pe baza de adaptare. Modul în care un program de face de fapt acest lucru este destul de complicat, după cum puteți vedea de discuțiile privind Data-Compression.com.

Indiferent de ceea ce metodă specifică utilizați, acest în profunzime sistemul de cautare vă permite să comprimați fișierul mult mai eficient decât ai putea cu doar alegem cuvinte. Folosind modele noi ales de mai sus, și adăugând " __ " pentru spații, am venit cu acest dicționar mai mare:

  1. ask__
  2. what__

  3. r__country
  4. __ can__do__for__you

    Și această frază mai mici: " 1not__2345 __ - __ 12354 "

    Sentința acum preia 18 de unități de memorie, și dicționarul nostru ocupă 41 de unitati. Deci ne-am comprimat dimensiunea totală fișier de 79 de unități la 59 de unități! Aceasta este doar o modalitate de a comprima fraza, și nu neapărat cel mai eficient. (A se vedea dacă puteți găsi o cale mai bună!)

    Deci, cât de bun este acest sistem? Raportul fișier de reducere a depinde de o serie de factori, inclusiv tipul de fișier, dimensiunea fișierului și sistem de compresie.

    În cele mai multe limbi ale lumii, anumite litere și cuvinte de multe ori apar împreună în același model. Datorită acestei rată mare de redundanță, fișiere text comprima foarte bine. O reducere de 50 la suta sau mai mult este tipic pentru un fișier text bun-sized. Cele mai mul

    Page [1] [2] [3] [4] [5] [6]