自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

談?wù)剶?shù)值壓縮存儲(chǔ)方法Varint

作者：smark 2012-05-03 15:01:24

開(kāi)發(fā) 開(kāi)發(fā)工具

我們經(jīng)常在網(wǎng)絡(luò)通訊的時(shí)候，需要把一些數(shù)據(jù)存儲(chǔ)到byte[]中然后再發(fā)送出去，數(shù)值則是我們經(jīng)常處理的數(shù)據(jù)成員。發(fā)越少的東西意味著使用更少的IO和帶寬。

在編寫(xiě)網(wǎng)絡(luò)通訊的時(shí)候我們經(jīng)常需要把一些數(shù)據(jù)存儲(chǔ)到byte[]中然后再發(fā)送出去，數(shù)值則是我們經(jīng)常處理的數(shù)據(jù)成員。發(fā)越少的東西意味著使用更少的IO和帶寬，所以對(duì)傳輸數(shù)據(jù)進(jìn)行壓縮也是件非常重要的事情。接下來(lái)提到的就是一種基于數(shù)字存儲(chǔ)的方式在大多數(shù)情況下可以節(jié)省數(shù)值存儲(chǔ)空間。

Varint 是一種緊湊的表示數(shù)字的方法。它用一個(gè)或多個(gè)字節(jié)來(lái)表示一個(gè)數(shù)字，值越小的數(shù)字使用越少的字節(jié)數(shù)。這能減少用來(lái)表示數(shù)字的字節(jié)數(shù)。比如對(duì)于 int32 類型的數(shù)字，一般需要 4 個(gè) byte 來(lái)表示。但是采用 Varint，對(duì)于很小的 int32 類型的數(shù)字，則可以用 1 個(gè) byte 來(lái)表示。當(dāng)然凡事都有好的也有不好的一面，采用 Varint 表示法，大的數(shù)字則需要 5 個(gè) byte 來(lái)表示。從統(tǒng)計(jì)的角度來(lái)說(shuō)，一般不會(huì)所有的消息中的數(shù)字都是大數(shù)，因此大多數(shù)情況下，采用 Varint 后，可以用更少的字節(jié)數(shù)來(lái)表示數(shù)字信息。下面就詳細(xì)介紹一下 Varint。

Varint 中的每個(gè) byte 的最高位 bit 有特殊的含義，如果該位為 1，表示后續(xù)的 byte 也是該數(shù)字的一部分，如果該位為 0，則結(jié)束。其他的 7 個(gè) bit 都用來(lái)表示數(shù)字。因此小于 128 的數(shù)字都可以用一個(gè) byte 表示。大于 128 的數(shù)字，比如 300，會(huì)用兩個(gè)字節(jié)來(lái)表示：1010 1100 0000 0010

由于負(fù)數(shù)的高位為1,所以采用這種壓縮處理的時(shí)候必須負(fù)數(shù)轉(zhuǎn)成正數(shù)，可以通過(guò)以下代碼實(shí)現(xiàn)int to uint的轉(zhuǎn)換

private static int Zag(uint ziggedValue)   
{   
int value = (int)ziggedValue;   
return (-(value & 0x01)) ^ ((value >> 1) & ~( 1<< 31));   
}   
private static uint Zig(int value)   
{   
return (uint)((value << 1) ^ (value >> 31));    
}

以下操作是對(duì)一個(gè)uint進(jìn)行編碼處理

private static ArraySegment<byte> WriteUInt32Variant(uint value)   
{   
byte[] data = new byte[5];   
int count = 0;   
do 
{   
data[count] = (byte)((value & 0x7F) | 0x80);   
count++;   
} while ((value >>= 7) != 0);   
data[count - 1] &= 0x7F;   
return new ArraySegment<byte>(data, 0, count);   
}

data[count] = (byte)((value & 0x7F) | 0x80); 得到頭7位的數(shù)值， | 0x80是表明后面的byte也是數(shù)字的一部分。

while ((value >>= 7) != 0) 右移7位如果不為零的情況下則繼續(xù)上面的工作。

data[count - 1] &= 0x7F 把最后byte的最高位設(shè)置成0;

接下來(lái)就是一個(gè)uint的解碼過(guò)程

private static uint ReadUInt32Variant(ArraySegment<byte> data)   
{   
uint value = data.Array[0];   
if ((value & 0x80) == 0) return value;   
value &= 0x7F;   
uint chunk = data.Array[1];   
value |= (chunk & 0x7F) << 7;   
if ((chunk & 0x80) == 0) return value;   
chunk = data.Array[2];   
value |= (chunk & 0x7F) << 14;   
if ((chunk & 0x80) == 0) return value;   
chunk = data.Array[3];   
value |= (chunk & 0x7F) << 21;   
if ((chunk & 0x80) == 0) return value;   
chunk = data.Array[4]; ;   
value |= chunk << 28;   
if ((chunk & 0xF0) == 0) return value;   
throw new OverflowException("ReadUInt32Variant Error!");   
}

(value & 0x80) == 0 表示最高位為0，說(shuō)明后面的byte已經(jīng)不是數(shù)值組成部分。

(chunk & 0xF0) == 0 chunk只有4位，如果不是則表明這個(gè)byte不是數(shù)值存儲(chǔ)的一部分。

測(cè)試一下看下編碼效果

ArraySegment<byte> data = WriteUInt32Variant(Zig(0));   
Console.WriteLine(data.Count);   
data = WriteUInt32Variant(Zig(567));   
Console.WriteLine(data.Count);   
data = WriteUInt32Variant(Zig(10000));   
Console.WriteLine(data.Count);   
data = WriteUInt32Variant(Zig(-100000));   
Console.WriteLine(data.Count);

分別是1byte,2byte,3byte,3byte

其實(shí)有人會(huì)有凝問(wèn)，為什么不根據(jù)情況來(lái)用int16等來(lái)存儲(chǔ)，如果一旦用了int16就說(shuō)明以后需要轉(zhuǎn)int32就是件非常麻煩的事情，雙方程序都需要調(diào)整。如果采用Varint進(jìn)行處理就能達(dá)到最好擴(kuò)展效果和帶寬利用率.

原文鏈接：http://www.cnblogs.com/smark/archive/2012/05/03/2480034.html

【編輯推薦】

詳解Java類的生命周期
Java代碼編寫(xiě)的30條建議
Java Excel API及詳細(xì)教程
Java集合框架和數(shù)組的排序
淺談Java中static作用

責(zé)任編輯：彭凡來(lái)源：博客園

數(shù)值壓縮

相似話題

前端
 28326內(nèi)容

后端
 26350內(nèi)容

測(cè)試
 530內(nèi)容

游戲開(kāi)發(fā)
654內(nèi)容
全部話題

同話題下的熱門(mén)內(nèi)容

Claude + MCP 正在取代 Cursor 與 Windsurf，背后到底發(fā)生了什么？震撼！比 Visio 快十倍的畫(huà)圖工具橫空殺來(lái)，誰(shuí)能頂?shù)米?/a>我的小網(wǎng)站被"薅禿"了，用 Trae 五分鐘給網(wǎng)站增加日志功能，揪出爬蟲(chóng)！這十個(gè) VSCode 插件，幫你大幅度提升開(kāi)發(fā)效率精選 14 款 .NET 開(kāi)源、功能強(qiáng)大的快速開(kāi)發(fā)框架，提高開(kāi)發(fā)生產(chǎn)效率、避免工作996！案例篇：如何用tcpdump和Wireshark識(shí)別潛在威脅日志查看神器 journalctl 詳解 C#性能暴增300%！這五個(gè)編譯器級(jí)黑魔法你絕對(duì)沒(méi)用過(guò)

相關(guān)專題更多

解讀惠普Z(yǔ)系列工作站ZBook Ultra G1a高性能移動(dòng)

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開(kāi)發(fā)者成長(zhǎng)學(xué)院 | 成長(zhǎng)有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開(kāi)發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營(yíng)

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動(dòng)態(tài)

站點(diǎn)地圖

意見(jiàn)反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號(hào)ECO中科愛(ài)克大廈6-7層

北京市公安局海淀分局備案編號(hào)：110108002980號(hào)
營(yíng)業(yè)執(zhí)照京ICP備09067568號(hào)

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請(qǐng)勿轉(zhuǎn)載

營(yíng)業(yè)執(zhí)照出版物經(jīng)營(yíng)許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動(dòng)科技科技行者 TechWeb 艾瑞網(wǎng)站長(zhǎng)之家速途網(wǎng)中國(guó)經(jīng)濟(jì)新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會(huì)議中國(guó)IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號(hào)

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<thead id="6pcgv"></thead>}
^{<sub id="6pcgv"></sub>}