C語言基礎(chǔ)之文件操作基本常識
我們都知道,在C語言中,文件操作都是由庫函數(shù)來完成的。下面會給大家介紹到輸入輸出等函數(shù),供參考 。
由于程序中經(jīng)常有大量對文件的輸入輸出操作,它經(jīng)常構(gòu)成了程序的主要部分,因而C語言提供了很多輸入輸出的函數(shù),它們分別用于兩種類型文件輸入輸出系統(tǒng):即由ANSI標準定義的緩沖文件(也稱標準文件(流)輸入輸出(I/O)系統(tǒng));另一類是ANSI標準中沒有定義的非緩沖文件(也稱非標準文件(流)輸入輸出(I/O)系統(tǒng))。
我們已經(jīng)熟悉了通過鍵盤和顯示器進行輸入輸出的一些函數(shù),如scanf(),printf()等等,這些通過控制臺(鍵盤、顯示器等)進行I/O的操作,可以看作標準文件輸入輸出系統(tǒng)的一些特例,實際上在標準輸入輸出系統(tǒng)中的一些函數(shù),有關(guān)文件的參數(shù)(文件結(jié)構(gòu)指針或稱流指針),只要用標準設(shè)備的流指針代替,這些標準輸入輸出函數(shù)即成為控制臺I/O函數(shù)。
在任何程序執(zhí)行時,C系統(tǒng)都定義了5個標準設(shè)備文件可供使用。自動打開的5個標準設(shè)備文件的文件結(jié)構(gòu)指針(在標準I/O系統(tǒng)中)和文件代號將有一個規(guī)定值:
設(shè)備 標準文件I/O系統(tǒng)中的流指針名 非標準文件……
鍵盤(標準輸入) stdin 0
顯示器(標準輸出) stdout 1
顯示器(標準錯誤) stderr 2
串行口(標準輔助) stdoux 3
打印機(標準打印) stdprn 4
這樣,不論在標準文件系統(tǒng)還是非標準文件系統(tǒng)中,文件結(jié)構(gòu)只要用上述的流指針或文件代號代替,則這些函數(shù)也均適用于控制臺設(shè)備。
一、文本流和二進制流
在C中引入了流(stream)的概念。它將數(shù)據(jù)的輸入輸出看作是數(shù)據(jù)的流入和流出,這樣不管是磁盤文件或者是物理設(shè)備(打印機、顯示器、鍵盤等),都可看作一種流的源和目的,視他們?yōu)橥环N東西,而不管其具體的物理結(jié)構(gòu),即對他們的操作,就是數(shù)據(jù)的流入和流出。
這種把數(shù)據(jù)的輸入輸出操作對象,抽象化為一種流,而不管它的具體結(jié)構(gòu)的方法很有利于編程,而涉及流的輸出操作函數(shù)可用于各種對象,與其具體的實體無關(guān),即具有通用性。
在C中流可分為兩大類,即文本流(text stream)和二進制流(binary stream)。所謂文本流是指在流中流動的數(shù)據(jù)是以字符形式出現(xiàn)。在文本流中,\'\\n\'被換成回車CR和換行LF的代碼0DH和0AH。而當輸出時,則0DH和0AH本換成\'\\n\'。
二進制流是指流動的是二進制數(shù)字序列,若流中有字符,則用一個字節(jié)的二進制ASCII碼表示,若是數(shù)字,則用一個字節(jié)的二進制數(shù)表示。在流入流出時,對\\n符號不進行變換。例如2001這個數(shù),在文本流中用其ASCII碼表示為:
\'2\' \'0\' \'0\' \'1\'
| | | |
50 48 48 49
共占4字節(jié)。而在二進制流中則表示為:00000111 11010001 用十六進制就是07D1。只占兩字節(jié)。
由此看出,二進制流比文本流節(jié)省空間,且不用進行對\\n的轉(zhuǎn)換,這樣可以大大加快流的速度,提高效率。因而,對于含有大量數(shù)字信息的數(shù)字流,可以采用二進制流的方式;對于含有大量字符信息的流,則采用文本流的方式。
二、流和文件
在C語言中流就是一種文件形式,它實際上就表示一個文件或設(shè)備(從廣義上講,設(shè)備也是一種文件)。把流當作文件總覺得不習(xí)慣,因而有人稱這種和流等同的文件為流式文件,流的輸入輸出也稱為文件的輸入輸出操作。當流到磁盤而成為文件時,意味著要啟動磁盤寫入操作,這樣流入一個字符(文本流)或流入一個字節(jié)(二進制流)均要啟動磁盤操作,將大大降低傳輸效率(磁盤是慢速設(shè)備),且降低磁盤的使用壽命。
為此,C語言在輸入輸出的使用使用了緩沖技術(shù),即在內(nèi)存為輸入的磁盤文件開辟了一個緩沖區(qū)(缺省為512字節(jié)),當流到該緩沖區(qū)裝滿后,再啟動磁盤一次,將緩沖區(qū)內(nèi)容裝到磁盤文件中去。讀取文件也是類似。
在C語言中將此種文件輸入輸出操作稱為標準輸入輸出,或稱流式輸入輸出(因這種輸入輸出操作是ANSI C推薦的標準)。還有一種是不帶緩沖文件輸入輸出,稱為非標準文件輸入輸出或低級輸入輸出,它將由DOS直接管理。關(guān)于這兩種輸入輸出文件系統(tǒng)下節(jié)將會介紹。
三、文件FILE的數(shù)據(jù)結(jié)構(gòu)
- typedef struct
- {
- short level;
- unsigned flags;
- char fd;
- unsigned char hold;
- short bsize;
- unsigned char *buffer;
- unsigned char *curp;
- unsigned istemp;
- short token;
- }FILE;
這是Turbo C中使用的定義(在stdio.h文件中),不同的C編譯器,可能使用不同的定義,但基本含義變化不會太大。
flags: 是一個10位的標志字,其具體含義如下:
位 | 代表符號 | 含義 |
0 | _F_READ | 讀 |
1 | _F_WRIT | 寫 |
2 | _F_BUF | 由fclose釋放緩沖區(qū) |
3 | _F_LBUF | 行緩沖 |
4 | _F_ERR | 出錯標志 |
5 | _F_EOF | EOF文件尾標志 |
6 | _F_BIN | 二進制方式 |
7 | _F_IN | 在進行輸入 |
8 | _F_OUT | 在進行輸出 |
9 |
_F_TERM | 文件是一個終端 |
其他各字段內(nèi)容以及flags字段內(nèi)各位所的功能,請參照其他一些資料。這里不多說了,它目前并不是我們要求的內(nèi)容。
應(yīng)該注意,不要把文件指針和FILE結(jié)構(gòu)指針混為一談,它們代表兩個不同的地址。文件指針指出了對文件當前讀寫的數(shù)據(jù)位置,而FILE結(jié)構(gòu)指針是指出了打開文件所對應(yīng)的FILE結(jié)構(gòu)在內(nèi)存中的地址,這個指針它實際本身也包含了文件指針的信息。流指針中的各字段是供C語言內(nèi)部使用的,用戶不應(yīng)該存取它的任何字段。
希望通過本文對文件操作的介紹,能夠給你帶來幫助。