TCP/IP網絡編程 --優(yōu)于select的epoll
關于并發(fā)服務器中的I/O復用實現(xiàn)方式,前面我們講過select的方式,但select的性能比較低,并不適合以Web服務器端開發(fā)為主流的現(xiàn)代開發(fā)環(huán)境。因此就有了Linux下的epoll,BSD的kqueue,Solaris的/dev/poll和Windows的IOCP等復用技術。本章就來講講Linux下的epoll技術。
epoll理解及應用
基于select的I/O復用技術速度慢的原因:
1,調用select函數(shù)后常見的針對所有文件描述符的循環(huán)語句。它每次事件發(fā)生需要遍歷所有文件描述符,找出發(fā)生變化的文件描述符。(以前寫的示例沒加循環(huán))
2,每次調用select函數(shù)時都需要向該函數(shù)傳遞監(jiān)視對象信息。即每次調用select函數(shù)時向操作系統(tǒng)傳遞監(jiān)視對象信息,至于為什么要傳?是因為我們監(jiān)視的套接字變化的函數(shù),而套接字是操作系統(tǒng)管理的。(這個才是最耗效率的)
注釋:基于這樣的原因并不是說select就沒用了,在這樣的情況下就適合選用select:1,服務端接入者少 2,程序應具有兼容性。
epoll是怎么優(yōu)化select問題的:
1,每次發(fā)生事件它不需要循環(huán)遍歷所有文件描述符,它把發(fā)生變化的文件描述符單獨集中到了一起。
2,僅向操作系統(tǒng)傳遞1次監(jiān)視對象信息,監(jiān)視范圍或內容發(fā)生變化時只通知發(fā)生變化的事項。
實現(xiàn)epoll時必要的函數(shù)和結構體
- 函數(shù):
- epoll_create:創(chuàng)建保存epoll文件描述符的空間,該函數(shù)也會返回文件描述符,所以終止時,也要調用close函數(shù)。(創(chuàng)建內存空間)
- epoll_ctl:向空間注冊,添加或修改文件描述符。(注冊監(jiān)聽事件)
- epoll_wait:與select函數(shù)類似,等待文件描述符發(fā)生變化。(監(jiān)聽事件回調)
- 結構體:
- struct epoll_event
- {
- __uint32_t events;
- epoll_data_t data;
- }
- typedef union epoll_data
- {
- void *ptr;
- int fd;
- __uinit32_t u32;
- __uint64_t u64;
- } epoll_data_t;
基于epoll的回聲服務器端
- //
- // main.cpp
- // hello_server
- //
- // Created by app05 on 15-10-19.
- // Copyright (c) 2015年 app05. All rights reserved.
- //
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #define BUF_SIZE 100
- #define EPOLL_SIZE 50
- void error_handling(char *buf);
- int main(int argc, const char * argv[]) {
- int serv_sock, clnt_sock;
- struct sockaddr_in serv_adr, clnt_adr;
- socklen_t adr_sz;
- int str_len, i;
- char buf[BUF_SIZE];
- //類似select的fd_set變量查看監(jiān)視對象的狀態(tài)變化,epoll_event結構體將發(fā)生變化的文件描述符單獨集中到一起
- struct epoll_event *ep_events;
- struct epoll_event event;
- int epfd, event_cnt;
- if(argc != 2)
- {
- printf("Usage: %s \n", argv[0]);
- exit(1);
- }
- serv_sock = socket(PF_INET, SOCK_STREAM, 0);
- if(serv_sock == -1)
- error_handling("socket() error");
- memset(&serv_adr, 0, sizeof(serv_adr));
- serv_adr.sin_family = AF_INET;
- serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
- serv_adr.sin_port = htons(atoi(argv[1]));
- if(bind(serv_sock, (struct sockaddr *) &serv_adr, sizeof(serv_adr)) == -1)
- error_handling("bind() error");
- if(listen(serv_sock, 5) == -1)
- error_handling("listen() error");
- //創(chuàng)建文件描述符的保存空間稱為“epoll例程”
- epfd = epoll_create(EPOLL_SIZE);
- ep_events = malloc(sizeof(struct epoll_event) *EPOLL_SIZE);
- //添加讀取事件的監(jiān)視(注冊事件)
- event.events = EPOLLIN; //讀取數(shù)據(jù)事件
- event.data.fd = serv_sock;
- epoll_ctl(epdf, EPOLL_CTL_ADD, serv_sock, &event);
- while (1)
- {
- //響應事件,返回發(fā)生事件的文件描述符數(shù)
- event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1); //傳-1時,一直等待直到事件發(fā)生
- if(event_cnt == -1)
- {
- puts("epoll_wait() error");
- break;
- }
- //服務端套接字和客服端套接字
- for (i = 0; i < event_cnt; i++) {
- if(ep_events[i].data.fd == serv_sock)//服務端與客服端建立連接
- {
- adr_sz = sizeof(clnt_adr);
- clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz);
- event.events = EPOLLIN;
- event.data.fd = clnt_sock;
- epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event);
- printf("connected client: %d \n", clnt_sock);
- }
- else //連接之后傳遞數(shù)據(jù)
- {
- str_len = read(ep_events[i].data.fd, buf, BUF_SIZE);
- if(str_len == 0)
- {
- //刪除事件
- epoll_ctl(epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL);
- close(ep_events[i].data.fd);
- printf("closed client: %d \n", ep_events[i].data.fd);
- }
- else
- {
- write(ep_events[i].data.fd, buf, str_len);
- }
- }
- }
- }
- close(serv_sock);
- close(epfd);
- return 0;
- }
- void error_handling(char *message)
- {
- fputs(message, stderr);
- fputc('\n', stderr);
- exit(1);
- }
條件觸發(fā)和邊緣觸發(fā)
什么是條件觸發(fā)和邊緣觸發(fā)?它們是指事件響應的方式,epoll默認是條件觸發(fā)的方式。條件觸發(fā)是指:只要輸入緩沖中有數(shù)據(jù)就會一直通知該事件,循環(huán)響應epoll_wait。而邊緣觸發(fā)是指:輸入緩沖收到數(shù)據(jù)時僅注冊1次該事件,即使輸入緩沖中還留有數(shù)據(jù),也不會再進行注冊,只響應一次。
邊緣觸發(fā)相對條件觸發(fā)的優(yōu)點:可以分離接收數(shù)據(jù)和處理數(shù)據(jù)的時間點,從實現(xiàn)模型的角度看,邊緣觸發(fā)更有可能帶來高性能。
將上面epoll實例改為邊緣觸發(fā):
1,首先改寫 event.events = EPOLLIN | EPOLLET; (EPOLLIN:讀取數(shù)據(jù)事件 EPOLLET:邊緣觸發(fā)方式)
2,邊緣觸發(fā)只響應一次接收數(shù)據(jù)事件,所以要一次性全部讀取輸入緩沖中的數(shù)據(jù),那么就需要判斷什么時候數(shù)據(jù)讀取完了?Linux聲明了一個全局的變量:int errno; (error.h中),它能記錄發(fā)生錯誤時提供額外的信息。這里就可以用它來判斷是否讀取完數(shù)據(jù):
- str_len = read(...);
- if(str_len < 0)
- {
- if(errno == EAGAIN) //讀取輸入緩沖中的全部數(shù)據(jù)的標志
- break;
- }
3,邊緣觸發(fā)方式下,以阻塞方式工作的read&write有可能會引起服務端的長時間停頓。所以邊緣觸發(fā)一定要采用非阻塞的套接字數(shù)據(jù)傳輸形式。那么怎么將套接字的read,write數(shù)據(jù)傳輸形式修改為非阻塞模式呢?
//fd套接字文件描述符,將此套接字數(shù)據(jù)傳輸模式修改為非阻塞
- void setnonblockingmode(int fd)
- {
- int flag = fcntl(fd, F_GETFL,0); //得到套接字原來屬性
- fcntl(fd, F_SETFL, flag | O_NONBLOCK);//在原有屬性基礎上設置添加非阻塞模式
- }