自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用哈弗曼編碼實現(xiàn)壓縮軟件

開發(fā) 開發(fā)工具
哈夫曼編碼(Huffman Coding)是一種編碼方式,哈夫曼編碼是可變字長編碼(VLC)的一種。uffman于1952年提出一種編碼方法,該方法完全依據(jù)字符出現(xiàn)概率來構(gòu)造異字頭的平均長 度最短的碼字,有時稱之為最佳編碼,一般就叫作Huffman編碼。本文介紹了用哈弗曼編碼實現(xiàn)壓縮軟件,一起來看。

哈夫曼壓縮是個無損的壓縮算法,一般用來壓縮文本和程序文件。哈夫曼壓縮屬于可變代碼長度算法一族。意思是個體符號(例如,文本文件中的字符)用一個特定長度的位序列替代。因此,在文件中出現(xiàn)頻率高的符號,使用短的位序列,而那些很少出現(xiàn)的符號,則用較長的位序列。我們先來看基本概念。 

1.什么是哈夫曼樹?

哈夫曼樹是一種***二叉樹,它的***點體現(xiàn)在它的的帶權(quán)路徑長度最小。(結(jié)點的帶權(quán)路徑長度為:結(jié)點的路徑長度乘以結(jié)點的權(quán)值,樹的帶權(quán)路徑長度為所有葉子結(jié)點帶權(quán)路徑長度之和)

2.什么是哈弗曼編碼?

從哈弗曼樹的根結(jié)點開始,按照左子樹分配代碼“0”,右子樹分配代碼“1”的規(guī)則,直到葉子結(jié)點為止,每個葉子結(jié)點的哈弗曼編碼就是從根結(jié)點開始,一直到該葉子結(jié)點為止,把途中經(jīng)過的代碼按順序串起來就OK了。

3.什么是哈弗曼壓縮?

Huffman( 哈夫曼 ) 算法在上世紀五十年代初提出來了,它是一種無損壓縮方法,在壓縮過程中不會丟失信息熵,而且可以證明 Huffman 算法在無損壓縮算法中是***的。 Huffman 原理簡單,實現(xiàn)起來也不困難,在現(xiàn)在的主流壓縮軟件得到了廣泛的應(yīng)用。對應(yīng)用程序、重要資料等絕對不允許信息丟失的壓縮場合, Huffman 算法是非常好的選擇。

哈夫曼壓縮,一般用來壓縮文本和程序文件。哈夫曼壓縮屬于可變代碼長度算法一族。意思是個體符號(例如,文本文件中的字符)用一個特定長度的位序列替代。因此,在文件中出現(xiàn)頻率高的符號,使用短的位序列,而那些很少出現(xiàn)的符號,則用較長的位序列。

有了以上的基本概念,我們就可以動手實現(xiàn)哈弗曼壓縮軟件了!

4.哈弗曼壓縮軟件的實現(xiàn):

在文件中,所有的數(shù)據(jù)都是以字節(jié)的形式存在的,一個字節(jié)是8位,所以所有可能出現(xiàn)的字節(jié)在0——256之間(不包括256),所以,***步要做的事情就是,把文件所有的字節(jié)的出現(xiàn)頻率統(tǒng)計出來,并用頻率做為權(quán)值生成一棵哈弗曼樹:

Java代碼:

  1. int[] ByteCount = new int[256];//字節(jié)頻率統(tǒng)計  
  2. InputStream fis = new FileInputStream(pathName_former);  
  3. InputStream bis = new BufferedInputStream(fis);//創(chuàng)建文件輸入流  
  4. while(bis.available()>0){  
  5. int tmp = bis.read();  
  6. ByteCount[tmp]++;  
  7. }//統(tǒng)計頻率  
  8. //構(gòu)造哈弗曼樹  
  9. hfmTree hfm = new hfmTree(ByteCount);  
  10. Java代碼  
  11. public hfmTree(int[] rank){//根據(jù)頻率構(gòu)造哈弗曼樹  
  12. //把頻率不為零的字節(jié)加入節(jié)點優(yōu)先級隊列  
  13. PriorityQueue nodes = new java.util.PriorityQueue();  
  14. for(int i=0;i  
  15. if(rank[i]!=0){  
  16. nodes.add(new hfmNode(rank[i],i));  
  17. }  
  18. }  
  19. //構(gòu)造哈弗曼樹  
  20. while(nodes.size()!=1){  
  21. hfmNode node_1 = nodes.poll();//1  
  22. hfmNode node_2 = nodes.poll();//2  
  23. hfmNode addNode = new hfmNode(node_1.getRank()+node_2.getRank(),0);  
  24. addNode.setLeft(node_1);  
  25. addNode.setRight(node_2);  
  26. nodes.add(addNode);  
  27. }  
  28. root = nodes.poll();  
  29. }//構(gòu)造函數(shù)(correct) 

 

接下來,要做的就是獲得0——256之間每個字節(jié)所對應(yīng)的哈弗曼編碼,用一個String[] Code = new Code[256]保存下來:

  1. Java代碼//獲得編碼  
  2. private void getStrByte(hfmNode node,String s){  
  3. if(node.getLeft()==null&&node.getRight()==null){  
  4. Code[node.getData()] = s;//獲得編碼字符串  
  5. }  
  6. if(node.getLeft()!=null){  
  7. getStrByte(node.getLeft(),s+"0");  
  8. }//左零 if(node.getRight()!=null){  
  9. getStrByte(node.getRight(),s+"1");  
  10. }//右1  
  11. }  
  12. 然后就是把每個字節(jié)的編碼長度打入文件:Java代碼//先將0-255的編碼長度打到文件里  
  13. for(int i=0;i  
  14. if(Code[i]==null||Code[i]==""){  
  15. Code[i] = "";  
  16. bos.write(0);  
  17. }else{  
  18. bos.write(Code[i].length());  
  19. }  

接下來就是,將每個字節(jié)的編碼打入文件(這里需要吧8個長度的01串轉(zhuǎn)換成一個byte打入文件):

  1. Java代碼//把每個字節(jié)的編碼表打到文件里  
  2. int i = 0;//第i個字節(jié)  
  3. int count = 0;//滿8打一,計數(shù)器  
  4. String writeCode = "";//寫入的8位編碼  
  5. String allCode = "";//所有待寫入的編碼  
  6. String inCode = "";  
  7. while(i<256||count>=8){  
  8. if(count>=8){//滿8  
  9. writeCode = allCode.substring(0,8);//前8位  
  10. count-=8;  
  11. allCode = allCode.substring(8);  
  12. bos.write(changeString(writeCode));//寫入一個字節(jié)  
  13. }else{  
  14. count+=Code[i].length();  
  15. allCode+=Code[i];  
  16. inCode+=Code[i];  
  17. i++;//嚴重錯誤發(fā)生地  
  18. }  
  19. }  
  20. //如果不滿8位的  
  21. if(allCode.length()>0){  
  22. int len = 8-allCode.length();//補零  
  23. for(int j=0;j  
  24. allCode+="0";  
  25. }  
  26. inCode+=allCode;  
  27. bos.write(changeString(allCode));  

 

***就是把文件中的所有字節(jié)按照這種哈弗曼的編碼方式保存到文件中,過程類似于上一步(在***打入末尾補入的0的個數(shù),主要是為了方便解壓縮):Java代碼//編碼表輸出完畢,將文件中的字節(jié)按照這種編碼方式壓縮。

  1. InputStream ins = new FileInputStream(pathName_former);  
  2. InputStream buf = new BufferedInputStream(ins);//創(chuàng)建輸入流  
  3. count = 0;  
  4. writeCode = "";  
  5. allCode = "";  
  6. while(buf.available()>0||count>=8){  
  7. if(count>=8){//滿8  
  8. writeCode = allCode.substring(0,8);//前8位  
  9. count-=8;  
  10. allCode = allCode.substring(8);  
  11. bos.write(changeString(writeCode));//寫入一個字節(jié)  
  12. }else{  
  13. int data = buf.read();  
  14. count+=Code[data].length();  
  15. allCode+=Code[data];  
  16. }  
  17. }  
  18. //如果不滿8位的  
  19. if(allCode.length()>0){  
  20. int len = 8-allCode.length();//補零  
  21. for(int j=0;j  
  22. allCode+="0";  
  23. }  
  24. bos.write(changeString(allCode));  
  25. bos.write(len);//補入了幾個0  
  26. }else{  
  27. bos.write(0);//補入了0個0  

到這里,整個壓縮過程基本完成了。希望對大家有幫助。

【編輯推薦】

  1. 詳細解析Java中抽象類和接口的區(qū)別
  2. 如何在Java應(yīng)用程序中動態(tài)分配CPU資源
  3. 常見的十四種Java開發(fā)工具的特點
  4. JavaScript開發(fā)規(guī)范要求
  5. JavaBean中使用JDBC方式進行事務(wù)處理
責任編輯:于鐵 來源: 互聯(lián)網(wǎng)
相關(guān)推薦

2011-04-28 10:07:24

哈弗曼編碼

2021-06-16 17:36:39

節(jié)點編碼哈夫曼樹

2015-03-03 14:10:53

shellcode哈夫曼編碼Huffy

2010-03-23 09:54:35

好壓壓縮

2021-04-24 07:50:59

壓縮軟件電腦

2021-10-31 07:24:12

Windows 11操作系統(tǒng)微軟

2021-03-12 19:40:55

Linux開源壓縮軟件

2022-06-22 07:50:47

NanaZip7-Zip開源

2011-08-11 16:41:09

bzip2中文man

2018-05-06 23:08:12

2022-12-20 11:20:07

PeaZip 8開源壓縮軟件

2021-12-30 08:25:35

開源壓縮軟件7-Zip 21.07

2010-09-10 15:56:08

2011-12-15 10:38:06

OPEN聯(lián)盟以太網(wǎng)

2021-01-04 21:00:53

開源軟件文件解壓開發(fā)者工具

2017-02-28 10:33:31

Python原理圖解

2016-01-08 19:10:00

京東智能

2010-05-04 17:06:38

Unix安裝

2023-05-09 09:00:39

7-Zip開源壓縮軟件

2022-05-09 11:46:49

亞馬遜云科技汽車哈曼
點贊
收藏

51CTO技術(shù)棧公眾號