自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<samp id="ubjz2"></samp>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Google開源Java字符編碼檢測(cè)工具介紹

作者：程序猿解碼 2020-09-20 22:10:04

新聞開發(fā)工具

產(chǎn)品經(jīng)理要求上傳文件到服務(wù)器，但是文件沒有模板，文件的編碼格式不定，因此不能通過指定的編碼格式解析文件，否則會(huì)出現(xiàn)亂碼。

背景

產(chǎn)品經(jīng)理要求上傳文件到服務(wù)器，但是文件沒有模板，文件的編碼格式不定，因此不能通過指定的編碼格式解析文件，否則會(huì)出現(xiàn)亂碼。

文件編碼識(shí)別

（1）UTF-8 BOM編碼的文件，前3個(gè)字節(jié)轉(zhuǎn)換成10進(jìn)制數(shù)后分別是：-17、-69、-65。

（2）UTF-16BE BOM編碼的文件，前2個(gè)字節(jié)轉(zhuǎn)換成10進(jìn)制數(shù)后分別是：-2、-1。

（3）UTF-16LE BOM編碼的文件，前2個(gè)字節(jié)轉(zhuǎn)換成10進(jìn)制數(shù)后分別是：-1、-2。

因此，這三種編碼格式的文件檢測(cè)起來比較簡(jiǎn)單，只需要拿到文件的前三個(gè)字節(jié)，然后根據(jù)上面的規(guī)則就可以確定文件是什么編碼。問題是這種檢測(cè)方式只能區(qū)分UTF-8 BOM、UTF-16BE BOM和UTF-16LE BOM編碼的文件，不能區(qū)分UTF-8和GBK編碼的文件。

Google開源Java字符編碼檢測(cè)工具介紹

Google字符編碼檢測(cè)工具

需要引入Maven依賴，Maven坐標(biāo)如下：

<dependency> 
    <groupId> 
        com.googlecode.juniversalchardet    </groupId> 
    <artifactId>juniversalchardet</artifactId> 
    <version>1.0.3</version> 
</dependency>

Google字符編碼檢測(cè)工具Java代碼示例，目前來看檢查UTF-8和GBK編碼沒有問題，但是其它編碼存在問題，由于上傳的文件只有中文和英文，因此稍微做了點(diǎn)兼容性處理，當(dāng)編碼獲取錯(cuò)誤時(shí)，默認(rèn)取GBK編碼。編碼檢測(cè)工具在生產(chǎn)環(huán)境運(yùn)行了一段時(shí)間，目前來看沒發(fā)現(xiàn)什么問題。

Google開源Java字符編碼檢測(cè)工具介紹

總結(jié)

由于上傳的文件只有中文和英文，在生產(chǎn)環(huán)境運(yùn)行了一段時(shí)間，目前來看是滿足要求的。比如Google的字符編碼檢測(cè)工具會(huì)返回WINDOWS-1252這樣的編碼格式，這種默認(rèn)用GBK編碼就可以。還有一些檢測(cè)不出來的編碼格式，返回null，這種也用默認(rèn)的GBK就行。

責(zé)任編輯：張燕妮來源：今日頭條

Google 開源工具

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<menuitem id="gli4e"><ul id="gli4e"></ul></menuitem>