自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux高性能網(wǎng)絡(luò)編程十談 | 系統(tǒng)調(diào)用

系統(tǒng) Linux
在談《系統(tǒng)調(diào)用》之前,先解答上一篇留下的一些問題:(1)發(fā)送方法返回成功后,數(shù)據(jù)一定發(fā)送到了TCP的對端么?(2)1個(gè)socket套接字可能被多個(gè)進(jìn)程在使用,出現(xiàn)并發(fā)訪問時(shí),內(nèi)核是怎么處理這種狀況的?

在談《系統(tǒng)調(diào)用》之前,先解答上一篇留下的一些問題:

(1)發(fā)送方法返回成功后,數(shù)據(jù)一定發(fā)送到了TCP的對端么?

send方法成功返回,并不一定表示數(shù)據(jù)發(fā)送到對端,TCP是可靠的協(xié)議,如果數(shù)據(jù)遇到異常,TCP底層會(huì)重傳,所以send調(diào)用成功只是代表數(shù)據(jù)拷貝到了內(nèi)核態(tài),同時(shí)調(diào)用IP層的方法返回后,也未必就保證此時(shí)數(shù)據(jù)一定發(fā)送成功。

(2)1個(gè)socket套接字可能被多個(gè)進(jìn)程在使用,出現(xiàn)并發(fā)訪問時(shí),內(nèi)核是怎么處理這種狀況的?

socket是可能被多個(gè)進(jìn)程同時(shí)訪問的,所以會(huì)有內(nèi)核鎖鎖住socket,如下內(nèi)核代碼:

int tcp_v4_rcv(struct sk_buff *skb)  
{  
    ...  
    // 是否有進(jìn)程正在使用這個(gè)套接字
    if (!sock_owned_by_user(sk)) {  
        ...
    } else {
        // 如果進(jìn)程正在操作套接字,就把skb指向的TCP報(bào)文插入到backlog隊(duì)列
        sk_add_backlog(sk, skb);
        ... 
    }
}

(3)若socket為默認(rèn)的阻塞套接字,調(diào)用recv方法傳入的len參數(shù),如果網(wǎng)絡(luò)包的數(shù)據(jù)小于len,recv會(huì)返回么?

當(dāng)前問題需要分情況看,根據(jù)SO_RCVLOWAT,tcp_low_latency和MSG_WAITALL參數(shù)會(huì)有不同的處理,如果SO_RCVLOWAT為1,則只要有報(bào)文就馬上返回到recv。

(4)當(dāng)socket被多進(jìn)程或者多線程共享時(shí),關(guān)閉連接時(shí)有何區(qū)別?

上一篇文章已經(jīng)說過,close是句柄引用減1,直到為0才會(huì)調(diào)用真正的關(guān)閉連接,而shutdown不管是否被共享,直接關(guān)閉連接。

第一部分:基礎(chǔ)API

1、主機(jī)字節(jié)序和網(wǎng)絡(luò)字節(jié)序

我們都知道字節(jié)序分位大端和小端:

  • 大端是高位字節(jié)在低地址,低位字節(jié)在高地址
  • 小端是順序字節(jié)存儲(chǔ),高位字節(jié)在高地址,低位字節(jié)在低地址

既然機(jī)器存在字節(jié)序不一樣,那么網(wǎng)絡(luò)傳輸過程中必然涉及到發(fā)出去的數(shù)據(jù)流需要轉(zhuǎn)換,所以發(fā)送端會(huì)將數(shù)據(jù)轉(zhuǎn)換為大端模式發(fā)送,系統(tǒng)提供API實(shí)現(xiàn)主機(jī)字節(jié)序和網(wǎng)絡(luò)字節(jié)序的轉(zhuǎn)換。

#include <netinet/in.h>
// 轉(zhuǎn)換長整型
unsigned long htonl(unsigned long int hostlong);
unsigned long ntohl(unsigned long int netlong);
// 轉(zhuǎn)換短整型
unsigned short htonl(unsigned short int hostshort);
unsigned short ntohl(unsigned short int netshort);

2、socket地址

(1)socket地址包含兩個(gè)部分,一個(gè)是什么協(xié)議,另一個(gè)是存儲(chǔ)數(shù)據(jù),如下:

struct sockaddr
{
    sa_family_t sa_family; // 取值:PF_UNIX(UNIX本地協(xié)議簇),PF_INET(ipv4),PF_INET6(ipv6)
    char sa_data[14]; // 根據(jù)上面的協(xié)議簇存儲(chǔ)數(shù)據(jù)(UNIX本地路徑,ipv4端口和IP,ipv6端口和IP)
};

(2)各個(gè)協(xié)議簇專門的結(jié)構(gòu)體

// unix本地協(xié)議簇
struct sockaddr_un
{
    sa_family_t sin_family; // AF_UNIX
    char sun_path[18];
};

// ipv4本地協(xié)議簇
struct sockaddr_in
{
    sa_family_t sin_family; // AF_INET
    u_int16_t sin_port;
    struct in_addr sin_addr;
};

// ipv6本地協(xié)議簇
struct sockaddr_in6
{
    sa_family_t sin_family; // AF_INET6
    u_int16_t sin6_port;
    u_int32_t sin6_flowinfo;
    ...
};

3、socket創(chuàng)建

socket,bind,listen,accept,connect,close和shutdown作為linux網(wǎng)絡(luò)開發(fā)必備知識(shí), 大家應(yīng)該都都耳熟能詳了,所以我就簡單介紹使用方式,重點(diǎn)介紹參數(shù)注意事項(xiàng)。

#include <sys/types.h>
#include <sys/socket.h>

int socket(int domain, int type, int protocol);

(1)domain參數(shù)目的是告訴底層協(xié)議簇,選項(xiàng)(PF_INET, PF_INET6和PF_UNIX);

(2)type指定服務(wù)類型(流數(shù)據(jù)和數(shù)據(jù)報(bào)),選項(xiàng)(SOCK_STREAM和SOCK_UGRAM);

(3)protocol默認(rèn)0即可;

注意:

socket的屬性SOCK_NONBLOCK和SOCK_CLOEXEC,分別標(biāo)識(shí)非阻塞和fork子進(jìn)程在子進(jìn)程中關(guān)閉socket;

4、bind

#include <sys/types.h>
#include <sys/socket.h>

int bind(int sock, const struct sockaddr* addr, socklen_t addrlen);

有了socket句柄,我們需要將句柄綁定到某個(gè)IP上,所以參數(shù)分別是通過socket創(chuàng)建的句柄和轉(zhuǎn)換后的struct sockaddr。

注意:

(1)返回錯(cuò)誤errno=EACCES:被綁定的地址是受保護(hù)的,比如端口0-1023不允許使用;

(2)返回錯(cuò)誤errno=EADDRINUSE:被綁定的地址正在使用,比如socket被其他已經(jīng)綁定了或者TIME_WAIT階段;

5、listen

#include <sys/socket.h>

int listen(int sock, int backlog);

(1)sock是socket的句柄;

(2)backlog在上一篇文章中講過,是處于半連接和完全連接的sock上限;

6、accept

#include <sys/types.h>
#include <sys/socket.h>

int accept(int sock, struct sockaddr *addr, socklen_t addrlen);

(1)sock是socket的句柄;

(2)addr用來獲取建立連接后的對端的地址;

詳細(xì)的accept建立連接流程,在上一篇文章也有詳細(xì)講過(可以重新翻閱一下), 這里要注意的是accept應(yīng)該如何和與高性能結(jié)合,這里留個(gè)疑問,下一篇文章將會(huì)介紹《IO復(fù)用》會(huì)詳細(xì)介紹。

7、connect

#include <sys/types.h>
#include <sys/socket.h>

int connect(int sock, const struct sockaddr *addr, socklen_t addrlen);

client端發(fā)起連接的函數(shù),sock是socket的句柄,addr連接的唯一地址,這個(gè)函數(shù)使用的注意事項(xiàng):

(1)返回ECONNREFUSED,標(biāo)識(shí)目標(biāo)端口不存在,連接被拒絕;

(2)返回ETIMEOUT,連接超時(shí);

8、close和shutdown

#include <unistd.h>

int close(int fd);
int shutdown(int sockfd, int flag);

這兩個(gè)函數(shù)的區(qū)別也在上一篇文章有提及,close不是真正關(guān)閉連接,只有fd引用計(jì)數(shù)為0才關(guān)閉,shutdown立即終止連接。

注意:

(1)shutdown的flag=SHUT_RD,關(guān)閉連接的讀端,不再執(zhí)行讀操作,socket的緩沖區(qū)數(shù)據(jù)都被清空;

(2)shutdown的flag=SHUT_WR,關(guān)閉連接的寫端,不再執(zhí)行寫操作,socket的緩沖區(qū)數(shù)據(jù)會(huì)在關(guān)閉之前全部發(fā)送出去;

(3)shutdown的flag=SHUT_RDWR,關(guān)閉連接的讀端和寫端,其緩沖區(qū)數(shù)據(jù)處理如上;

9、讀寫數(shù)據(jù)

TCP讀寫數(shù)據(jù):

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t send(int sockfd, const void *buf, size_t len, int flags);

這里要注意的是一些flags的使用:

(1)flags=MSG_OOB發(fā)送或者接收緊急數(shù)據(jù);

(2)flags=MSG_DONTWAIT對socket此次操作不阻塞;

(3)flags=MSG_WAITALL讀到指定大小的字節(jié)才返回;

(4)flags=MSG_MORE告訴內(nèi)核還有更多數(shù)據(jù)發(fā)送,讓內(nèi)核等數(shù)據(jù)一起發(fā)送提升性能;

UDP讀寫數(shù)據(jù):

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *addr, socklen_t *addrlen);
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *addr, socklen_t *addrlen);

由于UDP是無連接的,所以不需要connect或者accept直接填addr地址發(fā)送或者接收數(shù)據(jù)。

10、獲取地址信息

#include <sys/socket.h>

int getsockname(int sock, const struct sockaddr *addr, socklen_t *addrlen); 
int getpeername(int sock, const struct sockaddr *addr, socklen_t *addrlen);

(1)getsockname通過fd獲取【本端】的socket地址;

(2)getpeername通過fd獲取【對端】的socket地址;

11、一些socket選項(xiàng)

(1)SO_REUSEADDR強(qiáng)制處于TIME_WAIT狀態(tài)的socket句柄可以被bind;

(2)SO_RECVBUF和SO_SENDBUF設(shè)置socket句柄的發(fā)送緩沖區(qū)和接收緩沖區(qū)的大小;

(3)SO_RECVLOWAT和SO_SNDLOWAT設(shè)置句柄在緩沖區(qū)觸發(fā)I/O事件的大小,接收低潮限度和發(fā)送低潮限度默認(rèn)為1字節(jié);(4)SO_LINGER用于控制close系統(tǒng)調(diào)用在關(guān)閉TCP連接時(shí)的行為,其結(jié)構(gòu)體:

#include <sys/socket.h>
struct linger
{
    int l_onoff; // 開啟(非0)還是關(guān)閉(0)該選項(xiàng)
    int l_linger; // 滯留時(shí)間
};

// 1、l_onoff等于0(關(guān)閉),此時(shí)SO_LINGER選項(xiàng)不起作用,close用默認(rèn)行為來關(guān)閉socket;
// 2、l_onoff不為0(開啟),l_linger等于0,此時(shí)close系統(tǒng)調(diào)用立即返回,TCP模塊將丟棄被關(guān)閉的socket對應(yīng)的TCP發(fā)送緩沖區(qū)中殘留的數(shù)據(jù),同時(shí)給對方發(fā)送一個(gè)復(fù)位報(bào)文段(RST);
// 3、l_onoff不為0(開啟),l_linger大于0,此時(shí)close的行為取決于兩個(gè)條件:一是被關(guān)閉的socket對應(yīng)的TCP發(fā)送緩沖區(qū)是否還有殘留的數(shù)據(jù);二是該socket是阻塞的,還是非阻塞的,對于阻塞的socket,close將等待一段長為l_linger的時(shí)間,直到TCP模塊發(fā)送完所有殘留數(shù)據(jù)并得到對方的確認(rèn);如果這段時(shí)間內(nèi)TCP模塊沒有發(fā)送完殘留數(shù)據(jù)并得到對方的確認(rèn),那么close系統(tǒng)調(diào)用將返回-1并設(shè)置errno為EWOULDBLOCK;如果socket是非阻塞的,close將立即返回,此時(shí)我們需要根據(jù)其返回值和errno來判斷殘留數(shù)據(jù)是否已經(jīng)發(fā)送完畢;

第二部分:I/O函數(shù)

1、pipe

pipe作為IPC的一部分,其參數(shù)如下:

#include <unistd.h>

int pipe(int fd[2]);

通過fd[0]和fd[1]組成了管道的兩端,fd[0]只能讀出數(shù)據(jù),fd[1]只能寫入數(shù)據(jù),配合read和write使用,當(dāng)然管道的容量是有限制的(默認(rèn)是65536字節(jié)),可以通過fnctl修改大小。

2、socketpair

對比管道,我覺得socketpair更加方便,其參數(shù)如下:

#include<sys/types.h>
#include<sys/socket.h>
int socketpair(int domain, int type, int protocol, int fd[2]);

其中fd[2]和pipe一樣,不同的是可以讀也可以寫,domain參數(shù)設(shè)置為AF_UNIX。

3、dup和dup2

#include<unistd.h>
int dup(int oldfd);
int dup2(int oldfd, int newfd);

dup函數(shù)創(chuàng)建一個(gè)新的文件描述符,該新文件描述符和原有文件描述符oldfd指向相同的文件、管道或者網(wǎng)絡(luò)連接。并且dup返回的文件描述符總是取系統(tǒng)當(dāng)前可用的最小整數(shù)值;

dup2和dup類似,不過它將返回第一個(gè)不小于newfd的整數(shù)值的文件描述符,并且newfd這個(gè)文件描述符也將會(huì)指向oldfd指向的文件,原來的newfd指向的文件將會(huì)被關(guān)閉(除非newfd和oldfd相同),相比于dup函數(shù),dup2函數(shù)它的優(yōu)勢就是可以指定新的文件描述符的大小,用法比較靈活;

樣例如下:

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>

#define FILENAME    "test.txt"
int main(void)
{
    int fd1 = -1, fd2 = -1;
    fd1 = open(FILENAME, O_RDWR | O_CREAT | O_TRUNC, 0644);
    if (fd1 < 0)
    {
        return -1;
    }
    printf("fd1 = %d.\n", fd1);
    fd2 = dup2(fd1, 10);
    printf("fd2 = %d.\n", fd2); 
    close(fd1);
    return 0;
}

// 輸出
fd2 = 10

4、readv和writev

#include <sys/uio.h>

ssize_t readv(int fd, const struct iovec *iov, int iovcnt);
ssize_t writev(int fd, const struct iovec *iov, int iovcnt);

struct iovec {                   /* Scatter/gather array items */
   void  *iov_base;              /* Starting address */
   size_t iov_len;               /* Number of bytes to transfer */
};

fd被操作的目標(biāo)文件描述符,iov是iovec類型的數(shù)組,iovcnt是iov數(shù)組的長度,iovec結(jié)構(gòu)體封裝了一塊內(nèi)存的起始位置和長度。

readv和writev的目的將分散的內(nèi)存數(shù)據(jù)集中讀寫到文件描述符中,可以提升性能。

writev樣例如下:

...
char *str0 = "this is 0 ";
char *str1 = "this is 1";
struct iovec iov[2];
ssize_t nwritten;

iov[0].iov_base = str0;
iov[0].iov_len = strlen(str0);
iov[1].iov_base = str1;
iov[1].iov_len = strlen(str1);

nwritten = writev(STDOUT_FILENO, iov, sizeof(iov));
...

readv樣例如下:

...
char buf1[8] = { 0 };
char buf2[8] = { 0 };
struct iovec iov[2];
ssize_t nread;

iov[0].iov_base = buf1;
iov[0].iov_len = sizeof(buf1) - 1;
iov[1].iov_base = buf2;
iov[1].iov_len = sizeof(buf2) - 1;

nread = readv(STDIN_FILENO, iov, 2);
...

5、sendfile

通常對于文件的讀寫然后發(fā)送出去,會(huì)經(jīng)過磁盤->內(nèi)核態(tài)拷貝->用戶態(tài)read->用戶態(tài)write->內(nèi)核態(tài)拷貝->DMA,那么這里經(jīng)過多次上下文切換和拷貝,所以sendfile系統(tǒng)函數(shù)為了避免這些問題,實(shí)現(xiàn)零拷貝。

#include <sys/sendfile.h>

ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

(1)out_fd待讀出的文件fd,必須是一個(gè)socket句柄;

(2)in_fd待寫入的文件fd,必須是文件描述符,不能是管道或者socket句柄;

6、splice

splice用于在兩個(gè)文件描述符之間移動(dòng)數(shù)據(jù),也是一種重要零拷貝技術(shù)。

#include <fcntl.h>

ssize_t splice(int fd_in, loff_t *off_in, int fd_out, loff_t *off_out, size_t len, unsigned int flags);

(1)fd_in待輸入數(shù)據(jù)的文件描述符,如果fd_in是一個(gè)管道文件,那么off_in必須被設(shè)置為NULL;如果不是,那么off_in表示從輸入數(shù)據(jù)流的何處開始讀取數(shù)據(jù),此時(shí),若off_in被設(shè)置為NULL,則表示從輸入數(shù)據(jù)流的當(dāng)前偏移位置讀入;若off_in不為NULL,則將指出具體的偏移位置;

(2)fd_out/off_out參數(shù)含義與fd_in/off_in相同,不過用于輸出流;

責(zé)任編輯:華軒 來源: 周末程序猿
相關(guān)推薦

2024-03-18 13:43:20

Linux架構(gòu)

2023-11-01 11:59:13

2023-11-01 10:38:46

Linux高性能網(wǎng)絡(luò)編程

2023-11-01 11:40:46

Linux高性能網(wǎng)絡(luò)編程工具

2023-11-01 11:27:10

Linux協(xié)程

2023-11-01 11:51:08

Linux性能優(yōu)化

2023-11-01 11:07:05

Linux高性能網(wǎng)絡(luò)編程線程

2023-11-01 11:20:57

2023-11-01 11:13:58

Linux信號(hào)處理定時(shí)器

2023-11-01 10:43:31

Linux高性能網(wǎng)絡(luò)編程

2024-10-16 11:03:30

Linux高性能編程

2024-08-06 08:22:18

2024-10-06 14:37:52

2024-09-03 09:15:37

2020-11-06 18:51:17

LinuxTCP服務(wù)器

2022-03-21 14:13:22

Go語言編程

2021-02-06 09:40:11

LinuxCPU高性能

2023-03-10 09:11:52

高性能Go堆棧

2011-04-12 10:52:43

布線系統(tǒng)

2025-01-06 00:00:10

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)