C語言該怎么進階?你學(xué)會了嗎?
?C語言的入門還是很簡單的:
把這段代碼輸入文本編輯器vim,保存成hello.c文件:文件里的符號全是英文字符,別把分號打成中文字符。
然后用gcc編譯器它,命令為:gcc hello.c
獲得一個可運行的a.out文件,在命令行里直接運行它:./a.out
可以看到打印的hello world字符串。
如果gcc編譯出來的a.out文件沒有自動加執(zhí)行權(quán)限,可以自己加上,命令為:
chmod +x a.out
初學(xué)者在這段代碼里出的錯誤,基本都是忘了打結(jié)尾的分號,或者使用了中文字符而導(dǎo)致的。
學(xué)會了這段代碼之后,C語言就可以算入門了。
這段代碼雖然很短,但涉及到了頭文件、宏、函數(shù)、字符串/數(shù)字 常量、return 語句,涵蓋了C語言50%的常用語法吧?
剩下的語法,就是一些運算符、if else、while for、switch case等語句類型。
1.C語言入門階段的最后一關(guān),是指針。
指針,是一個表示變量的內(nèi)存地址的無符號整數(shù),位數(shù)跟CPU的字長相同。
64位機上,指針是8個字節(jié)。
老式的32位機上,指針是4個字節(jié)。
指針的字節(jié)數(shù),跟long類型的整數(shù)一樣。
數(shù)組的指針,指的是數(shù)組的“首地址”:數(shù)組的第0號元素的內(nèi)存地址。
C語言從0開始編號,數(shù)組元素的內(nèi)存地址與它的編號一一對應(yīng):
&a[i] == (unsigned long)a + i * sizeof(a[0]);
所以,指針是一個unsigned long型的(無符號)整數(shù)。
指針變量,是一個保存某種類型的數(shù)據(jù)的內(nèi)存地址的變量。
指針的類型,是它指向的數(shù)據(jù)的類型。
指針的++和--運算,一次跳過(它指向的)1個元素的字節(jié)數(shù):int型指針++和--的變化是sizeof(int)個字節(jié)。
大多數(shù)系統(tǒng)上,sizeof(int) == 4.
2.C語言的文件讀寫,是關(guān)系到操作系統(tǒng)的。
C語言的文件函數(shù)
上圖是C語言的文件函數(shù),下圖是Linux的文件函數(shù)。
C語言標(biāo)準(zhǔn)庫的文件函數(shù),最終也是使用OS的系統(tǒng)調(diào)用(其他語言的標(biāo)準(zhǔn)庫也一樣)。
操作系統(tǒng)為了把功能提供給應(yīng)用層,都有一套API:其中的重點就是文件和網(wǎng)絡(luò)編程的API。
API這個詞來自windows,Linux上一般叫系統(tǒng)調(diào)用(syscall)。
Linux的文件函數(shù)
windows有它自己的應(yīng)用編程框架(C#,VS),windows上的C語言都是通過VC++支持的:VC++,VS里的C++?
現(xiàn)在,C語言的應(yīng)用編程,主要還是在Linux上。
Linux的系統(tǒng)調(diào)用,是C程序員在學(xué)會了基礎(chǔ)內(nèi)容之后,下一個階段要熟悉的。
Linux繼承的是Unix,它的API和Unix的區(qū)別不大:
要熟悉Linux系統(tǒng),最好的參考資料還是那本老書:Unix環(huán)境高級編程?
這本書的作者理查德-史蒂文斯1999年就過世了,但他的書依然是最好的Linux編程書。
當(dāng)然,最主要的參考資料還是Linux的man手冊:在命令行里輸入man open,就可以打開open()函數(shù)的手冊,里面有open()函數(shù)的詳細用法。
把man open換成man socket,就可以打開socket函數(shù)的手冊。
對同一個詞的介紹,在man手冊里可能有好幾頁:一個是對同名的Linux命令的介紹,另一個是對同名的Linux函數(shù)的介紹。
如果直接man open打開的不是函數(shù)介紹,可以用man 2 open,或者man 3 open等,通過數(shù)字去選頁數(shù)。
3.Linux的常用函數(shù):
1)open, close, read, write, fcntl
這些都是跟文件相關(guān)的函數(shù),作用跟函數(shù)名一樣。
fcntl:可以給文件加鎖,給socket設(shè)置非阻塞,用法比較復(fù)雜,可以參考man手冊。
2)lseek
移動文件指針到哪個位置,用法跟C庫的fseek一樣。
3)socket, bind, listen, accept, connect, send / recv, sendto / recvfrom
這些都是網(wǎng)絡(luò)編程的API,
socket:創(chuàng)建socket描述符,即網(wǎng)絡(luò)文件的句柄。
Linux上一切都是文件,socket也被看做一個文件。
bind:綁定socket到某個IP和端口號。
listen:讓socket進入監(jiān)聽狀態(tài),用于服務(wù)器端監(jiān)聽某個IP和端口號。
accept:用于服務(wù)器端接受用戶的連接。
connect:用于客戶端連接到服務(wù)器。
send / recv:TCP協(xié)議的數(shù)據(jù)發(fā)送和接收。
sendto / recvfrom:UDP協(xié)議的數(shù)據(jù)發(fā)送和接收。
關(guān)閉socket,也是使用close()函數(shù)。
4)epoll_create, epoll_wait, epoll_ctl
Linux的epoll異步事件機制,
用于同時監(jiān)控多個socket網(wǎng)絡(luò)連接的讀寫狀態(tài),并進行高并發(fā)的異步處理,它是網(wǎng)絡(luò)服務(wù)器的核心函數(shù)。
俄羅斯人寫的Nginx服務(wù)器,底層就是這3個函數(shù)。
nginx
5)setsockopt / getsockopt
設(shè)置或讀取網(wǎng)絡(luò)socket的狀態(tài),細節(jié)參考Linux man手冊。
getsockopt的其中一個應(yīng)用就是,它在異步連接時用于讀取連接的錯誤碼:相當(dāng)于connect()函數(shù)的返回值,只是這個過程在異步獲取的。
6)fork / execve
fork:以當(dāng)前進程為藍本,創(chuàng)建一個子進程。
execve:給當(dāng)前進程加載一個新的可執(zhí)行程序,并替換它的用戶內(nèi)存空間。
在多進程編程里,這2個是基本的函數(shù),但一般并不常用。
多進程的網(wǎng)絡(luò)服務(wù)器Nginx,就是用fork()創(chuàng)建多個進程的。
7)pthread_create
Linux上的pthread線程庫的函數(shù),用于在當(dāng)前進程里創(chuàng)建一個線程。
pthread系列函數(shù),也是一組跟多線程編程的函數(shù)。
4.匯編語言
不會匯編語言的C程序員,不是好程序員?
實際上,想學(xué)明白C語言的話,還是要學(xué)匯編語言。
不會匯編語言的話,像全局變量、局部變量、動態(tài)庫、內(nèi)存、操作系統(tǒng)這些跟C語言有關(guān)的東西,也是很難學(xué)明白的。
C語言,既是個大號的匯編語言,又是個OS的應(yīng)用層膠水。
C語言,既離不了匯編語言,也離不了OS。
匯編語言就3個關(guān)鍵:內(nèi)存、寄存器、棧。
這條匯編代碼運行之前,內(nèi)存什么狀態(tài)、寄存器什么狀態(tài)、棧是什么狀態(tài)?
這條匯編代碼運行之后,內(nèi)存什么狀態(tài),寄存器什么狀態(tài),棧是什么狀態(tài)?
記住這6個狀態(tài),也就學(xué)會了匯編語言了。
5.算法
算法關(guān)系到數(shù)學(xué),算法導(dǎo)論是最好的參考資料。
當(dāng)然,數(shù)學(xué)越好,越容易學(xué)算法。
但OpenCV開源之后,大多數(shù)情況下,用不到自己寫算法?
跟圖像處理、視覺識別相關(guān)的算法,OpenCV幾乎都有。
算法工程師做的,更多是把這些基礎(chǔ)算法整合成一個特定場景的識別模型。
6.圖形界面
C語言可以選各種圖形界面庫,例如GTK,SDL,QT,etc.
想做界面程序的話,選一種自己看著順眼的圖形庫,然后熟悉一下它的C語言API就行了。
一般來說,圖形庫的API都是支持多種語言的,C語言也是其中之一。