自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<abbr id="jilyz"></abbr>

<sub id="jilyz"><i id="jilyz"></i></sub>

^{<sub id="jilyz"></sub>}

<legend id="jilyz"></legend><thead id="jilyz"><rt id="jilyz"></rt></thead>

<legend id="jilyz"></legend>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

一文讓你讀懂JAVA.IO、字符編碼

作者：JAVA互聯(lián)搬磚工人 2020-11-12 09:14:25

開(kāi)發(fā) 后端

本篇給大家介紹JAVA.IO、字符編碼，希望對(duì)你有所幫助。

1 JAVA.IO字節(jié)流

inputstream.png

LineNumberInputStream和StringBufferInputStream官方建議不再使用，推薦使用LineNumberReader和StringReader代替
ByteArrayInputStream和ByteArrayOutputStream 字節(jié)數(shù)組處理流，在內(nèi)存中建立一個(gè)緩沖區(qū)作為流使用，從緩存區(qū)讀取數(shù)據(jù)比從存儲(chǔ)介質(zhì)(如磁盤(pán))的速率快

//用ByteArrayOutputStream暫時(shí)緩存來(lái)自其他渠道的數(shù)據(jù) 
ByteArrayOutputStream data = new ByteArrayOutputStream(1024); //1024字節(jié)大小的緩存區(qū) 
data.write(System.in.read()); // 暫存用戶輸入數(shù)據(jù) 
 
//將data轉(zhuǎn)為ByteArrayInputStream 
ByteArrayInputStream in = new ByteArrayInputStream(data.toByteArray());

FileInputStream和FileOutputStream 訪問(wèn)文件，把文件作為InputStream，實(shí)現(xiàn)對(duì)文件的讀寫(xiě)操作
ObjectInputStream和ObjectOutputStream 對(duì)象流，構(gòu)造函數(shù)需要傳入一個(gè)流，實(shí)現(xiàn)對(duì)JAVA對(duì)象的讀寫(xiě)功能;可用于序列化，而對(duì)象需要實(shí)現(xiàn)Serializable接口

//java對(duì)象的寫(xiě)入 
FileOutputStream fileStream = new FileOutputStream("example.txt"); 
ObjectOutputStream out = new ObjectOutputStream(fileStream); 
Example example = new Example(); 
out.writeObject(example); 
 
//java對(duì)象的讀取 
FileInputStream fileStream = new FileInputStream("example.txt"); 
ObjectInputStream in = new ObjectInputStream(fileStream); 
Example = (Example) in.readObject();

PipedInputStream和PipedOutputStream 管道流，適用在兩個(gè)線程中傳輸數(shù)據(jù)，一個(gè)線程通過(guò)管道輸出流發(fā)送數(shù)據(jù)，另一個(gè)線程通過(guò)管道輸入流讀取數(shù)據(jù)，實(shí)現(xiàn)兩個(gè)線程間的數(shù)據(jù)通信

// 創(chuàng)建一個(gè)發(fā)送者對(duì)象 
Sender sender = new Sender(); // 創(chuàng)建一個(gè)接收者對(duì)象 
Receiver receiver = new Receiver(); // 獲取輸出管道流 
// 獲取輸入輸出管道流 
PipedOutputStream outputStream = sender.getOutputStream();  
PipedInputStream inputStream = receiver.getInputStream(); 
// 鏈接兩個(gè)管道，這一步很重要，把輸入流和輸出流聯(lián)通起來(lái)   
outputStream.connect(inputStream); 
sender.start();// 啟動(dòng)發(fā)送者線程 
receiver.start();// 啟動(dòng)接收者線程

SequenceInputStream 把多個(gè)InputStream合并為一個(gè)InputStream，允許應(yīng)用程序把幾個(gè)輸入流連續(xù)地合并起來(lái)

InputStream in1 = new FileInputStream("example1.txt"); 
InputStream in2 = new FileInputStream("example2.txt"); 
SequenceInputStream sequenceInputStream = new SequenceInputStream(in1, in2); 
//數(shù)據(jù)讀取 
int data = sequenceInputStream.read();

FilterInputStream和FilterOutputStream 使用了裝飾者模式來(lái)增加流的額外功能，子類構(gòu)造參數(shù)需要一個(gè)InputStream/OutputStream

ByteArrayOutputStream out = new ByteArrayOutputStream(2014); 
//數(shù)據(jù)寫(xiě)入，使用DataOutputStream裝飾一個(gè)InputStream 
//使用InputStream具有對(duì)基本數(shù)據(jù)的處理能力 
DataOutputStream dataOut = new DataOutputStream(out); 
dataOut.writeDouble(1.0); 
//數(shù)據(jù)讀取 
ByteArrayInputStream in = new ByteArrayInputStream(out.toByteArray()); 
DataInputStream dataIn = new DataInputStream(in); 
Double data = dataIn.readDouble();

DataInputStream和DataOutputStream (Filter流的子類) 為其他流附加處理各種基本類型數(shù)據(jù)的能力,如byte、int、String
BufferedInputStream和BufferedOutputStream (Filter流的子類) 為其他流增加緩沖功能
PushBackInputStream (FilterInputStream子類) 推回輸入流，可以把讀取進(jìn)來(lái)的某些數(shù)據(jù)重新回退到輸入流的緩沖區(qū)之中
PrintStream (FilterOutputStream子類) 打印流，功能類似System.out.print

2 JAVA.IO字符流

21.png

從字節(jié)流和字符流的導(dǎo)向圖來(lái)，它們之間是相互對(duì)應(yīng)的，比如CharArrayReader和ByteArrayInputStream
字節(jié)流和字符流的轉(zhuǎn)化：InputStreamReader可以將InputStream轉(zhuǎn)為Reader,OutputStreamReader可以將OutputStream轉(zhuǎn)為Writer

//InputStream轉(zhuǎn)為Reader 
InputStream inputStream = new ByteArrayInputStream("程序".getBytes()); 
InputStreamReader reader = new InputStreamReader(inputStream, StandardCharsets.UTF_8); 
//OutputStream轉(zhuǎn)為Writer 
OutputStream out = new FileOutputStream("example.txt"); 
OutputStreamWriter writer = new OutputStreamWriter(out); 
//以字符為單位讀寫(xiě) 
writer.write(reader.read(new char[2]));

區(qū)別：字節(jié)流讀取單位是字節(jié)，字符流讀取單位是字符;一個(gè)字符由字節(jié)組成，如變字長(zhǎng)編碼UTF-8是由1~4個(gè)字節(jié)表示

3 亂碼問(wèn)題和字符流

字符以不同的編碼表示，它的字節(jié)長(zhǎng)度(字長(zhǎng))是不一樣的。如“程”的utf-8編碼格式，由[-25][-88][-117]組成。而ISO_8859_1編碼則是單個(gè)字節(jié)[63]
平時(shí)工作對(duì)資源的操作都是面向字節(jié)流的，然而數(shù)據(jù)資源根據(jù)不同的字節(jié)編碼轉(zhuǎn)為字節(jié)時(shí)，它們的內(nèi)容是不一樣，容易造成亂碼問(wèn)題
兩種出現(xiàn)亂碼場(chǎng)景 encode和decode使用的字符編碼不一致：資源使用UTF-8編碼，而在代碼里卻使用GBK解碼打開(kāi)使用字節(jié)流讀取字節(jié)數(shù)不符合字符規(guī)定字長(zhǎng)：字符是由字節(jié)組成的，比如“程”的utf-8格式是三個(gè)字節(jié);如果在InputStream里以每?jī)蓚€(gè)字節(jié)讀取流，再轉(zhuǎn)為String(java默認(rèn)編碼是utf-8)，此時(shí)會(huì)出現(xiàn)亂碼(半個(gè)中文，你猜是什么)

ByteArrayInputStream in = new ByteArrayInputStream("程序大法好".getBytes()); 
byte[] buf = new byte[2]; //讀取流的兩個(gè)字節(jié) 
in.read(buf); //讀取數(shù)據(jù) 
System.out.println(new String(buf)); //亂碼 
---result----  
�  //亂碼

亂碼場(chǎng)景1，知道資源的字符編碼，就可以使用對(duì)應(yīng)的字符編碼來(lái)解碼解決
亂碼場(chǎng)景2，可以一次性讀取所有字節(jié)，再一次性編碼處理。但是對(duì)于大文件流，這是不現(xiàn)實(shí)的，因此有了字符流的出現(xiàn)
字節(jié)流使用InputStreamReader、OutputStreamReader轉(zhuǎn)化為字符流，其中可以指定字符編碼，再以字符為單位來(lái)處理，可解決亂碼

InputStreamReader reader =  
      new InputStreamReader(inputStream, StandardCharsets.UTF_8);

4 字符集和字符編碼的概念區(qū)分

字符集和字符編碼的關(guān)系，字符集是規(guī)范，字符編碼是規(guī)范的具體實(shí)現(xiàn);字符集規(guī)定了符號(hào)和二進(jìn)制代碼值的唯一對(duì)應(yīng)關(guān)系，但是沒(méi)有指定具體的存儲(chǔ)方式;
unicode、ASCII、GB2312、GBK都是字符集;其中ASCII、GB2312、GBK既是字符集也是字符編碼;注意不混淆這兩者區(qū)別;而unicode的具體實(shí)現(xiàn)有UTF-8，UTF-16，UTF-32
最早出現(xiàn)的ASCII碼是使用一個(gè)字節(jié)(8bit)來(lái)規(guī)定字符和二進(jìn)制映射關(guān)系，標(biāo)準(zhǔn)ASCII編碼規(guī)定了128個(gè)字符，在英文的世界，是夠用的。但是中文，日文等其他文字符號(hào)怎么映射呢?因此其他更大的字符集出現(xiàn)了
unicode(統(tǒng)一字符集)，早期時(shí)它使用2個(gè)byte表示1個(gè)字符，整個(gè)字符集可以容納65536個(gè)字符。然而仍然不夠用，于是擴(kuò)展到4個(gè)byte表示一個(gè)字符，現(xiàn)支持范圍是U+010000~U+10FFFF
unicode是兩個(gè)字節(jié)的說(shuō)法是錯(cuò)誤的;UTF-8是變字長(zhǎng)的，需要用1~4個(gè)字節(jié)存儲(chǔ);UTF-16一般是兩個(gè)字節(jié)(U+0000~U+FFFF范圍)，如果遇到兩個(gè)字節(jié)存不下，則用4個(gè)字節(jié);而UTF-32是固定四個(gè)字節(jié)
unicode表示的字符，會(huì)用“U+”開(kāi)頭，后面跟著十六進(jìn)制的數(shù)字，如“字”的編碼就是U+5B57
UTF-8 編碼和unicode字符集

范圍 Unicode(Binary) UTF-8編碼(Binary) UTF-8編碼byte長(zhǎng)度 U+0000~U+007F 00000000 00000000 00000000 0XXXXXXX 0XXXXXX 1 U+0080~U+07FF 00000000 00000000 00000YYY YYXXXXXX 110YYYYY 10XXXXXX 2 U+0800~U+FFFF 00000000 00000000 ZZZZYYYY YYXXXXXX 1110ZZZZ 10YYYYYY 10XXXXXX 3 U+010000~U+10FFFF 00000000 000AAAZZ ZZZZYYYY YYXXXXXX 11110AAA 10ZZZZZZ 10YYYYYY 10XXXXXX 4

程序是分內(nèi)碼和外碼，java的默認(rèn)編碼是UTF-8，其實(shí)指的是外碼;內(nèi)碼傾向于使用定長(zhǎng)碼，和內(nèi)存對(duì)齊一個(gè)原理，便于處理。外碼傾向于使用變長(zhǎng)碼，變長(zhǎng)碼將常用字符編為短編碼，罕見(jiàn)字符編為長(zhǎng)編碼，節(jié)省存儲(chǔ)空間與傳輸帶寬
JDK8的字符串，是使用char[]來(lái)存儲(chǔ)字符的，char是兩個(gè)字節(jié)大小，其中使用的是UTF-16編碼(內(nèi)碼)。而unicode規(guī)定的中文字符在U+0000~U+FFFF內(nèi)，因此使用char(UTF-16編碼)存儲(chǔ)中文是不會(huì)出現(xiàn)亂碼的
JDK9后，字符串則使用byte[]數(shù)組來(lái)存儲(chǔ)，因?yàn)橛幸恍┳址粋€(gè)char已經(jīng)存不了，如emoji表情字符，使用字節(jié)存儲(chǔ)字符串更容易拓展
JDK9，如果字符串的內(nèi)容都是ISO-8859-1/Latin-1字符(1個(gè)字符1字節(jié))，則使用ISO-8859-1/Latin-1編碼存儲(chǔ)字符串，否則使用UTF-16編碼存儲(chǔ)數(shù)組(2或4個(gè)字節(jié))

System.out.println(Charset.defaultCharset()); //輸出java默認(rèn)編碼 
for (byte item : "程序".getBytes(StandardCharsets.UTF_16)) { 
    System.out.print("[" + item + "]"); 
} 
System.out.println(""); 
for (byte item : "程序".getBytes(StandardCharsets.UTF_8)) { 
    System.out.print("[" + item + "]"); 
} 
----result---- 
UTF-8       //java默認(rèn)編碼UTF-8 
[-2][-1][122][11][94][-113] //UTF_16：6個(gè)字節(jié)？ 
[-25][-88][-117][-27][-70][-113] //UTF_8：6個(gè)字節(jié) 正常

“程序”的UTF-16編碼竟是輸出6個(gè)字節(jié)，多出了兩個(gè)字節(jié)，這是什么情況？再試試一個(gè)字符的輸

for (byte item : "程".getBytes(StandardCharsets.UTF_16)) { 
    System.out.print("[" + item + "]"); 
} 
---result-- 
[-2][-1][122][11]

可以看出UTF-16編碼的字節(jié)是多了[-2][-1]兩個(gè)字節(jié)，十六進(jìn)制是0xFEFF。而它用來(lái)標(biāo)識(shí)編碼順序是Big endian還是Little endian。以字符'中'為例，它的unicode十六進(jìn)制是4E2D，存儲(chǔ)時(shí)4E在前，2D在后，就是Big endian;2D在前，4E在后，就是Little endian。FEFF表示存儲(chǔ)采用Big endian，F(xiàn)FFE表示使用Little endian
為什么UTF-8沒(méi)有字節(jié)序的問(wèn)題呢?個(gè)人看法，因?yàn)閁TF-8是變長(zhǎng)的，由第一個(gè)字節(jié)的頭部的0、110、1110、11110判斷是否需后續(xù)幾個(gè)字節(jié)組成字符，使用Big endian易讀取處理，反過(guò)來(lái)不好處理，因此強(qiáng)制用Big endian
其實(shí)感覺(jué)UTF-16可以強(qiáng)制規(guī)定用Big endian;但這其中歷史問(wèn)題。。。

【編輯推薦】

Python雖好，但請(qǐng)不要盲目將它用于每一個(gè)項(xiàng)目！
紅帽開(kāi)放混合云助力企業(yè)成為數(shù)字原生企業(yè)
分析鴻蒙系統(tǒng)helloworld程序是如何被調(diào)用，SYS_RUN做什么事情
5G為何突然間就“不火”了？
新方向、新功能：Python3.9 完整版面世了

責(zé)任編輯：姜華來(lái)源：今日頭條

JAVA.IO、字符編碼

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="wx1u1"><p id="wx1u1"><form id="wx1u1"></form></p></sub>

<sub id="wx1u1"><p id="wx1u1"></p></sub>

<thead id="wx1u1"><rt id="wx1u1"></rt></thead>

<acronym id="wx1u1"></acronym>