自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="e1j4r"></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

C#讀取二進(jìn)制文件淺析

作者：霓虹下的草 2009-08-12 18:06:53

開(kāi)發(fā) 后端

C#讀取二進(jìn)制文件是如何進(jìn)行的呢？C#讀取二進(jìn)制文件是怎么樣實(shí)現(xiàn)，以及C#讀取二進(jìn)制文件的各種問(wèn)題是如何的呢？

C#讀取二進(jìn)制文件

當(dāng)想到所有文件都轉(zhuǎn)換為 XML時(shí)，確實(shí)是一件好事。但是，這并非事實(shí)。仍舊還有大量的文件格式不是XML，甚至也不是ASCII。二進(jìn)制文件仍然在網(wǎng)絡(luò)中傳播，儲(chǔ)存在磁盤上，在應(yīng)用程序之間傳遞。相比之下，在處理這些問(wèn)題方面，它們比文本文件顯得更有效率些。

C#讀取二進(jìn)制文件之比較：在 C 和 C++ 中，讀取二進(jìn)制文件還是很容易的。除了一些開(kāi)始符（carriage return）和結(jié)束符（line feed）的問(wèn)題，每一個(gè)讀到C/C++中的文件都是二進(jìn)制文件。事實(shí)上，C/C++ 只知道二進(jìn)制文件，以及如何讓二進(jìn)制文件像文本文件一樣。當(dāng)我們使用的語(yǔ)言越來(lái)越抽象時(shí)，我們***使用的語(yǔ)言就不能直接、容易的讀取創(chuàng)建的文件了。這些語(yǔ)言想要用它們自己獨(dú)特的方式來(lái)自動(dòng)處理輸出數(shù)據(jù)。

C#讀取二進(jìn)制文件問(wèn)題的所在

在許多計(jì)算機(jī)科學(xué)領(lǐng)域，C 和 C++ 仍舊直接依照數(shù)據(jù)結(jié)構(gòu)來(lái)儲(chǔ)存和讀取數(shù)據(jù)。在C和C++中，依照內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)來(lái)讀取和寫文件，是十分簡(jiǎn)單的。在C中，你只需要使用fwrite()函數(shù)，并提供下列參數(shù)：一個(gè)指向你的數(shù)據(jù)的指針，告訴它有多少個(gè)數(shù)據(jù)，一個(gè)數(shù)據(jù)有多大。這樣，就直接用二進(jìn)制格式把數(shù)據(jù)寫成文件了。

如上所述的那樣把數(shù)據(jù)寫成文件，同時(shí)如果你也知道其正確的數(shù)據(jù)結(jié)構(gòu)的話，那么也就意味著讀取文件也很容易。你只要使用 fread() 函數(shù)，并提供下列參數(shù)：一個(gè)文件句柄，一個(gè)指向數(shù)據(jù)的指針，讀取多少個(gè)數(shù)據(jù)，每一個(gè)數(shù)據(jù)的長(zhǎng)度。 fread() 函數(shù)幫你把其余的事都做了。突然，數(shù)據(jù)又回到了內(nèi)存中。沒(méi)有采用解析以及也沒(méi)有對(duì)象模型的方式，它只是把文件直接的讀到內(nèi)存中。

在C和C++中，***的兩個(gè)問(wèn)題就是數(shù)據(jù)對(duì)齊（structure alignment）和字節(jié)交換（byte swapping）。數(shù)據(jù)對(duì)齊指的是有時(shí)編譯器會(huì)跳過(guò)數(shù)據(jù)中間的字節(jié)，因?yàn)槿绻幚砥髟L問(wèn)到那些字節(jié)，就不再處于***化狀態(tài)下了，要花費(fèi)更多的時(shí)間（一般情況，處理器訪問(wèn)未對(duì)齊數(shù)據(jù)花費(fèi)的時(shí)間是訪問(wèn)對(duì)齊數(shù)據(jù)的兩倍），花費(fèi)更多的指令。因此，編譯器要為了執(zhí)行速度而進(jìn)行優(yōu)化，跳過(guò)了那些字節(jié)并重新進(jìn)行排序。另一方面，字節(jié)交換指的是：由于不同處理器對(duì)字節(jié)排序的方式不同，需要對(duì)數(shù)據(jù)的字節(jié)重新排序的過(guò)程。

C#讀取二進(jìn)制文件之?dāng)?shù)據(jù)對(duì)齊

因?yàn)樘幚砥髂軌蛞淮翁幚砀嗟男畔ⅲㄔ谝粋€(gè)時(shí)鐘周期內(nèi)），所以它們希望它們所處理的信息能以一種確定的方式排列。大多數(shù)的 Intel 處理器使整數(shù)類型（32位的）的儲(chǔ)存首地址能被4除盡（即：從能被4除盡的地址上開(kāi)始儲(chǔ)存）。如果內(nèi)存中的整數(shù)不是儲(chǔ)存在4的倍數(shù)的地址上的話，它們是不會(huì)工作的。編譯器知道這些。因此當(dāng)編譯器遇到一個(gè)可能引起這種問(wèn)題的數(shù)據(jù)時(shí)，它們就有下面三種選擇。

***種，它們可以選擇在數(shù)據(jù)中添加一些無(wú)用的白空格符，這樣可以使整數(shù)的開(kāi)始地址能被4除盡。這是一種最普遍的做法。第二種，它們可以對(duì)字段重新排序，以便使整數(shù)處于4位的邊界上。因?yàn)檫@樣會(huì)造成其它有趣的問(wèn)題，因此，這種方式較少使用。第三種選擇是，允許數(shù)據(jù)中的整數(shù)不處于4位的邊界上，但是把代碼復(fù)制到一個(gè)合適的地方從而使那些整數(shù)處于4位的邊界上。這種方式需要一些額外的時(shí)間花費(fèi)，但是，如果必須壓縮的話，那么它就很有用了。

以上所說(shuō)的這些大都是編譯器的細(xì)節(jié)問(wèn)題，你用不著過(guò)多的擔(dān)心。如果你對(duì)寫數(shù)據(jù)的程序和讀數(shù)據(jù)的程序使用同樣的編譯器，同樣的設(shè)定，那么，這些就不成其為問(wèn)題了。編譯器用同樣的方法來(lái)處理同樣的數(shù)據(jù)，一切都OK。但是當(dāng)你涉及到跨平臺(tái)文件轉(zhuǎn)換問(wèn)題時(shí)，用正確的方式來(lái)排列所有數(shù)據(jù)就顯得很重要了，這樣才能保證信息能被轉(zhuǎn)換。另外，一些程序員還了解怎樣讓編譯器不用理睬他們的數(shù)據(jù)。

C#讀取二進(jìn)制文件之字節(jié)交換（byte swapping）：高位優(yōu)先（big endians）和低位優(yōu)先（little endians）

高位優(yōu)先和低位優(yōu)先，指的是兩種不同的方式，把整數(shù)儲(chǔ)存在計(jì)算機(jī)中的的方式。因?yàn)檎麛?shù)是多于一個(gè)字節(jié)的，那么，問(wèn)題在于：最重要的字節(jié)是否應(yīng)該首先被讀寫。最不重要的字節(jié)是變化的最頻繁的。這就是，如果你不斷給一個(gè)整數(shù)加一，最不重要的字節(jié)要改變256次，次不重要的字節(jié)才只變化一次。

不同的處理器用不同的方式儲(chǔ)存整數(shù)。Intel 處理器一般用低位優(yōu)先方式來(lái)儲(chǔ)存整數(shù)，換句話說(shuō)，低位首先被讀寫。大多數(shù)其它處理器用高位優(yōu)先方式來(lái)儲(chǔ)存整數(shù)。因此，當(dāng)二進(jìn)制文件在不同平臺(tái)上讀寫時(shí)，你就有可能不得不對(duì)字節(jié)重新排序以便得到正確的順序。

在 UNIX 平臺(tái)上，還有一種特殊的問(wèn)題，因?yàn)閁NIX可以在Sun Sparc處理器、HP處理器、ＩＢＭ　Power　PC、Inter的芯片等多種處理器上運(yùn)行。當(dāng)從一種處理器轉(zhuǎn)移到另一種處理器上時(shí)，就意味著那些變量的字節(jié)排列順序必須翻轉(zhuǎn)，以便于它們能滿足新處理器所要求的順序。

C#讀取二進(jìn)制文件之用C# 處理二進(jìn)制文件

用C# 處理二進(jìn)制文件的話，就會(huì)有另外兩項(xiàng)新的挑戰(zhàn)。***項(xiàng)挑戰(zhàn)是：所有的 .NET 語(yǔ)言都是強(qiáng)類型的。因此，你不得不從文件中的字節(jié)流轉(zhuǎn)換為你所想要的數(shù)據(jù)類型。第二項(xiàng)挑戰(zhàn)就是：一些數(shù)據(jù)類型比它們表面上要復(fù)雜的多，需要某種轉(zhuǎn)換。

C#讀取二進(jìn)制文件之類型破壞（type breaking）

因?yàn)?.NET 語(yǔ)言，包括 C#，都是強(qiáng)類型的，你不能只是任意的從文件中讀取一段字節(jié)，然后塞到數(shù)據(jù)結(jié)構(gòu)中就一切OK了。因此當(dāng)你要破壞類型轉(zhuǎn)換規(guī)則時(shí)，你就不得不這樣做了，首先讀取你所需要的字節(jié)數(shù)到一個(gè)字節(jié)數(shù)組中，然后把它們從頭到尾的復(fù)制到數(shù)據(jù)結(jié)構(gòu)中。

在 Usenet （注：世界性的新聞組網(wǎng)絡(luò)系統(tǒng)）的文檔中搜尋，你會(huì)找到幾個(gè)構(gòu)架在 microsoft.public.dotnet層次上的一組程序，它們可以容許你把任何對(duì)象轉(zhuǎn)換為一系列字節(jié)，并可以重新轉(zhuǎn)換回對(duì)象。它們可以在下面地址找到 Listing A

C#讀取二進(jìn)制文件之復(fù)雜的數(shù)據(jù)類型

在 C++ 中，你明白什么是對(duì)象，什么是數(shù)組，什么既不是對(duì)象又不是數(shù)組。但是在 C# 中，事情并不像看起來(lái)的那樣簡(jiǎn)單。一個(gè)字符串（string）就是一個(gè)對(duì)象，因此也是一個(gè)數(shù)組。因?yàn)樵?C# 中，既沒(méi)有真正的數(shù)組，許多對(duì)象也沒(méi)有固定尺寸，因此一些復(fù)雜數(shù)據(jù)類型并不適合成為固定尺寸的二進(jìn)制數(shù)據(jù)。

幸好，.NET 提供了一種方式來(lái)解決這種問(wèn)題。你可以告訴 C# ，你想怎樣處理你的字符串（string）和其它類型的數(shù)組。這將通過(guò) MarshalAs 屬性來(lái)完成。下面這個(gè)例子，就是在 C# 中使用字符串，這屬性必須要在所控制的數(shù)據(jù)使用之前被使用：

[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 50)]

你想要從二進(jìn)制文件中讀取，或者儲(chǔ)存到二進(jìn)制文件中的字符串（string）的長(zhǎng)度就決定了參數(shù) SizeConst 的大小。這樣就確定了字符串長(zhǎng)度的***值。

解決以前的問(wèn)題

現(xiàn)在，你知道了 .NET 引入的問(wèn)題是怎樣被解決的了。那么，在后面，你就可以了解到，解決前面所遇到的二進(jìn)制文件問(wèn)題是那么的容易。

C#讀取二進(jìn)制文件之包裝（pack）

不用麻煩的去設(shè)定編譯器來(lái)控制如何排列數(shù)據(jù)。你只需使用 StructLayout 屬性就可以使數(shù)據(jù)依照你的意愿來(lái)排列或打包。當(dāng)你需要不同的數(shù)據(jù)有著不同的包裝方式的時(shí)候，這就顯得十分有用了。這就像裝扮你的汽車一樣，任你的喜好。使用 StructLayout 屬性就像你很小心的決定是否把每一個(gè)數(shù)據(jù)都緊湊包裝或者還是只將它們隨便打發(fā)，只要它們能夠被重新讀出來(lái)就行了。 StructLayout 屬性的使用如下面所示：

[StructLayout(LayoutKind.Sequential, Pack = 1)]

這樣做可以使數(shù)據(jù)忽略邊界對(duì)齊，讓數(shù)據(jù)盡可能的緊湊包裝。這個(gè)屬性應(yīng)當(dāng)和你從二進(jìn)制文件中讀取的任何數(shù)據(jù)的屬性都保持一致（即：你寫到文件中的屬性應(yīng)和從文件讀出來(lái)屬性保持不變）。

你也許會(huì)發(fā)現(xiàn)，即使給你的數(shù)據(jù)加上了這個(gè)屬性后，也沒(méi)有完全解決問(wèn)題。在某些情況下，你可能不得不進(jìn)行沉悶冗長(zhǎng)的反復(fù)實(shí)驗(yàn)。由于不同計(jì)算機(jī)和編譯器在二進(jìn)制層次上的有著不同的運(yùn)行處理方式，這就是引起上述問(wèn)題的原因。特別是在跨平臺(tái)時(shí)，我們都必須特別小心的處理二進(jìn)制數(shù)據(jù)。 .NET 是個(gè)好工具，適合其它二進(jìn)制文件，但是也并不是一個(gè)***的工具。

C#讀取二進(jìn)制文件之字節(jié)排列順序的翻轉(zhuǎn)（endian flipping）

讀寫二進(jìn)制文件的經(jīng)典問(wèn)題之一就是：某些計(jì)算機(jī)首先是儲(chǔ)存最不重要的字節(jié)（如：Inter），而另外一些計(jì)算機(jī)是首先儲(chǔ)存最重要的字節(jié)。在 C 和 C++ 中，你不得不手動(dòng)處理這個(gè)問(wèn)題，而且只能是一個(gè)字段一個(gè)字段的翻轉(zhuǎn)。而 .NET 框架的優(yōu)點(diǎn)之一就是：代碼可以在運(yùn)行時(shí)訪問(wèn)類型的元數(shù)據(jù)（metadata），你也就能夠讀取信息，并使用它來(lái)自動(dòng)解決數(shù)據(jù)中每一段的字節(jié)排列順序問(wèn)題。在 Listing B 上可以找到源代碼，你可以了解是如何處理的。

一旦你得知對(duì)象的類型，你能夠獲得數(shù)據(jù)里的每個(gè)部分，并開(kāi)始檢查每一個(gè)部分，并確定其是否是一個(gè)16位或32位的無(wú)符號(hào)整數(shù)。在任何一種上述情況下，你都可以改變字節(jié)的排序順序，而且不會(huì)破壞數(shù)據(jù)。

C#讀取二進(jìn)制文件的相關(guān)信息內(nèi)容就向你介紹到這這里，希望對(duì)你學(xué)習(xí)C#讀取二進(jìn)制文件有所幫助。

注意：你不是用字符串類（string）來(lái)完成所有的事。是采用高位優(yōu)先還是低位優(yōu)先，并不會(huì)影響到字符串類。那些字段是不受翻轉(zhuǎn)代碼的影響。你也只是要注意無(wú)符號(hào)整數(shù)而已。因?yàn)?，?fù)數(shù)在不同的系統(tǒng)上，并不是使用同一種表示方式的。負(fù)數(shù)可以只用一個(gè)記號(hào)（一位字節(jié)）表示，但是更常用的，卻是使用兩個(gè)記號(hào)（兩位字節(jié)）表示。這使得負(fù)數(shù)在跨平臺(tái)時(shí)有些更困難。幸運(yùn)的是，負(fù)數(shù)在二進(jìn)制文件中極少使用。

這只是多說(shuō)幾句了，同樣的，浮點(diǎn)數(shù)有時(shí)并不是用標(biāo)準(zhǔn)方式表示的。盡管大多數(shù)系統(tǒng)是以IEEE格式為基礎(chǔ)來(lái)設(shè)置浮點(diǎn)數(shù)的，但是還是有一小部分老的系統(tǒng)使用了其它的格式來(lái)設(shè)置浮點(diǎn)數(shù)的。

克服困難

盡管 C# 還是有一些問(wèn)題，但是你依舊能夠使用它來(lái)讀取二進(jìn)制文件。實(shí)際上，由于 C# 所使用的那種用來(lái)訪問(wèn)對(duì)象的元數(shù)據(jù)（metadata）的方式，使它成為一種能夠更好讀取二進(jìn)制文件的語(yǔ)言。因此， C# 能夠自動(dòng)解決整個(gè)數(shù)據(jù)的字節(jié)交換（byte swapping）問(wèn)題。

【編輯推薦】

C#讀取文件夾下面的全部文件的實(shí)現(xiàn)
C#讀取文件內(nèi)容另存的實(shí)現(xiàn)
C#讀取文件高效方法淺析
C#讀文本文件的冰山一角
C#讀取文本文件時(shí)字符編碼的處理

責(zé)任編輯：仲衡來(lái)源：百度空間

C#讀取二進(jìn)制文件

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sup id="krdwe"><rt id="krdwe"></rt></sup>

<s id="krdwe"><li id="krdwe"></li></s>

^{<thead id="krdwe"></thead>}

<legend id="krdwe"></legend>