Linux內(nèi)核中的塊設(shè)備驅(qū)動(dòng)
在現(xiàn)代計(jì)算機(jī)系統(tǒng)中,塊設(shè)備驅(qū)動(dòng)程序是操作系統(tǒng)內(nèi)核中一個(gè)重要的組成部分,它用于管理硬盤(pán)、閃存等存儲(chǔ)設(shè)備。Linux內(nèi)核是一個(gè)開(kāi)源、自由的操作系統(tǒng)內(nèi)核,驅(qū)動(dòng)程序源代碼公開(kāi)可用,可以幫助開(kāi)發(fā)人員更好地了解Linux內(nèi)核塊設(shè)備驅(qū)動(dòng)的工作原理。
一、塊設(shè)備驅(qū)動(dòng)程序的基礎(chǔ)概念
1、塊設(shè)備驅(qū)動(dòng)程序的作用
塊設(shè)備驅(qū)動(dòng)程序是一種負(fù)責(zé)管理塊設(shè)備(如硬盤(pán)、NVMe快閃存儲(chǔ)器等)的軟件組件,它負(fù)責(zé)實(shí)現(xiàn)塊設(shè)備的讀寫(xiě)操作、磁盤(pán)緩存的管理等。塊設(shè)備驅(qū)動(dòng)程序使得操作系統(tǒng)內(nèi)核和各種應(yīng)用程序都可以通過(guò)標(biāo)準(zhǔn)的接口訪問(wèn)塊設(shè)備。
2、Linux內(nèi)核塊設(shè)備驅(qū)動(dòng)程序中的主要數(shù)據(jù)結(jié)構(gòu)
在Linux內(nèi)核中,塊設(shè)備驅(qū)動(dòng)程序主要包含以下數(shù)據(jù)結(jié)構(gòu):
(1)bio
I/O操作描述符(I/O descriptor,簡(jiǎn)稱(chēng)bio)是Linux內(nèi)核中塊設(shè)備驅(qū)動(dòng)程序中最基本的數(shù)據(jù)結(jié)構(gòu)。它描述了一個(gè)塊設(shè)備操作的所有細(xì)節(jié)和參數(shù),包括讀寫(xiě)操作的塊數(shù)、讀寫(xiě)的數(shù)據(jù)指針、物理地址、緩沖區(qū)大小、操作類(lèi)型等。bio數(shù)據(jù)結(jié)構(gòu)的重要性在于它是向塊設(shè)備發(fā)送I/O操作的載體。
(2)request_queue
request_queue是塊設(shè)備驅(qū)動(dòng)程序中的另一個(gè)重要的數(shù)據(jù)結(jié)構(gòu),它管理著一組bio數(shù)據(jù)結(jié)構(gòu)。request_queue中可以管理多個(gè)bio請(qǐng)求,并且可以高效地組織和處理這些請(qǐng)求。當(dāng)一個(gè)新的I/O請(qǐng)求到來(lái)時(shí),request_queue會(huì)將其和之前未完成的請(qǐng)求進(jìn)行合并,以提高I/O操作的效率。
(3)gendisk設(shè)備結(jié)構(gòu)
gendisk設(shè)備結(jié)構(gòu)是Linux內(nèi)核中塊設(shè)備驅(qū)動(dòng)程序的子結(jié)構(gòu)之一,它是塊設(shè)備驅(qū)動(dòng)程序和塊設(shè)備層之間的接口數(shù)據(jù)結(jié)構(gòu)。每個(gè)塊設(shè)備(如硬盤(pán)、固態(tài)硬盤(pán)等)都對(duì)應(yīng)著一個(gè)gendisk設(shè)備結(jié)構(gòu),以便于被塊設(shè)備驅(qū)動(dòng)程序和塊設(shè)備層管理和訪問(wèn)。gendisk設(shè)備結(jié)構(gòu)中包括了塊設(shè)備的主要屬性,例如塊大小、可訪問(wèn)的扇區(qū)數(shù)、分區(qū)信息、分塊信息等。
3、Linux內(nèi)核塊設(shè)備驅(qū)動(dòng)程序的主要工作流程
Linux內(nèi)核中塊設(shè)備驅(qū)動(dòng)程序的主要工作流程如下:
(1)初始化塊設(shè)備驅(qū)動(dòng)程序
在Linux內(nèi)核中,塊設(shè)備驅(qū)動(dòng)程序的初始化通常是在模塊加載時(shí)完成的(即init函數(shù)中完成初始化)。塊設(shè)備驅(qū)動(dòng)程序的初始化包括注冊(cè)塊設(shè)備驅(qū)動(dòng)程序、創(chuàng)建gendisk設(shè)備結(jié)構(gòu)以及建立request_queue等。
(2)接受并處理I/O請(qǐng)求
塊設(shè)備驅(qū)動(dòng)程序通常是被塊設(shè)備層調(diào)用的,以提供塊設(shè)備的讀寫(xiě)服務(wù),塊設(shè)備層會(huì)將I/O請(qǐng)求通過(guò)request_queue發(fā)送給塊設(shè)備驅(qū)動(dòng)程序,塊設(shè)備驅(qū)動(dòng)程序會(huì)在這里接收到并處理I/O請(qǐng)求。
(3)處理I/O請(qǐng)求
塊設(shè)備驅(qū)動(dòng)程序主要實(shí)現(xiàn)I/O請(qǐng)求的處理,其處理流程通常包括以下幾個(gè)步驟:
- 將待處理的I/O請(qǐng)求從request_queue中取出。
- 將請(qǐng)求轉(zhuǎn)化為通用的bio數(shù)據(jù)結(jié)構(gòu)。
- 將bio數(shù)據(jù)結(jié)構(gòu)添加到硬件設(shè)備的操作隊(duì)列中。
- 等待硬件設(shè)備完成I/O請(qǐng)求。
- 在I/O請(qǐng)求完成后,將bio數(shù)據(jù)結(jié)構(gòu)從硬件設(shè)備的操作隊(duì)列中移除,并修改I/O請(qǐng)求的狀態(tài)。
(4)釋放塊設(shè)備驅(qū)動(dòng)程序資源
在Linux內(nèi)核中,塊設(shè)備驅(qū)動(dòng)程序資源的釋放實(shí)際上是由模塊卸載時(shí)完成的(即exit函數(shù)中完成資源釋放)。在資源釋放時(shí),塊設(shè)備驅(qū)動(dòng)程序需要注銷(xiāo)注冊(cè)設(shè)備、刪除gendisk設(shè)備結(jié)構(gòu)以及銷(xiāo)毀request_queue等。
二、塊設(shè)備驅(qū)動(dòng)程序源代碼分析
1、塊設(shè)備驅(qū)動(dòng)程序的編寫(xiě)
Linux內(nèi)核中塊設(shè)備驅(qū)動(dòng)程序涉及到很多I/O操作,因此需要仔細(xì)編寫(xiě)。下面分別簡(jiǎn)要介紹塊設(shè)備驅(qū)動(dòng)程序的讀、寫(xiě)和I/O請(qǐng)求處理函數(shù)的編寫(xiě)方法。
(1)塊設(shè)備驅(qū)動(dòng)程序的讀函數(shù)編寫(xiě)
塊設(shè)備驅(qū)動(dòng)程序的讀函數(shù)(read函數(shù))通常是異步的,即它不會(huì)等待傳輸完成。當(dāng)執(zhí)行一個(gè)讀請(qǐng)求時(shí),驅(qū)動(dòng)程序中的read函數(shù)會(huì)創(chuàng)建一個(gè)讀取請(qǐng)求,并將其添加到request_queue隊(duì)列中等待處理。一旦請(qǐng)求被添加到request_queue中,驅(qū)動(dòng)程序就會(huì)返回給調(diào)用者一個(gè)代表讀請(qǐng)求正在處理的值。
(2)塊設(shè)備驅(qū)動(dòng)程序的寫(xiě)函數(shù)編寫(xiě)
塊設(shè)備驅(qū)動(dòng)程序的寫(xiě)函數(shù)(write函數(shù))與讀函數(shù)類(lèi)似,也是異步的,與讀函數(shù)不同的是它需要等待寫(xiě)操作完成。當(dāng)執(zhí)行一個(gè)寫(xiě)請(qǐng)求時(shí),驅(qū)動(dòng)程序中的write函數(shù)會(huì)創(chuàng)建一個(gè)寫(xiě)請(qǐng)求,并將其添加到request_queue隊(duì)列中等待處理。一旦請(qǐng)求被添加到request_queue中,驅(qū)動(dòng)程序就會(huì)等待寫(xiě)操作完成后將控制權(quán)限返回給調(diào)用者。
(3)塊設(shè)備驅(qū)動(dòng)程序的I/O請(qǐng)求處理函數(shù)編寫(xiě)
塊設(shè)備驅(qū)動(dòng)程序中最重要的函數(shù)是I/O請(qǐng)求處理函數(shù),它被用來(lái)接收和處理所有接收到的I/O請(qǐng)求。當(dāng)新的I/O請(qǐng)求到來(lái)時(shí),塊設(shè)備層會(huì)將請(qǐng)求通過(guò)request_queue發(fā)送給塊設(shè)備驅(qū)動(dòng)程序中的I/O請(qǐng)求處理函數(shù)進(jìn)行處理。
I/O請(qǐng)求處理函數(shù)主要包括以下幾個(gè)步驟:
- 判斷請(qǐng)求類(lèi)型,并將其應(yīng)用到相應(yīng)的數(shù)據(jù)結(jié)構(gòu)中。
- 將請(qǐng)求轉(zhuǎn)化為通用的bio數(shù)據(jù)結(jié)構(gòu)。
- 將bio數(shù)據(jù)結(jié)構(gòu)添加到硬件設(shè)備的操作隊(duì)列中。
- 等待硬件設(shè)備完成I/O請(qǐng)求。
- 在I/O請(qǐng)求完成后,將bio數(shù)據(jù)結(jié)構(gòu)從硬件設(shè)備的操作隊(duì)列中移除,并修改I/O請(qǐng)求的狀態(tài)。
2、塊設(shè)備驅(qū)動(dòng)程序源代碼
下面為讀者介紹Linux內(nèi)核塊設(shè)備驅(qū)動(dòng)程序的一個(gè)例子(內(nèi)核版本為4.19.0),該程序負(fù)責(zé)管理SATA磁盤(pán)設(shè)備的讀寫(xiě)操作。
(1)塊設(shè)備驅(qū)動(dòng)程序的頭文件
#include
#include
#include
#include
(2)塊設(shè)備驅(qū)動(dòng)程序的聲明
/* Major number */
static int dev_major = 0;
/* Number of volumes to manage */
static int volumes_count = 3;
/* Default block size for devices (2^logical) */
static int block_size = 512;
/* Sector size of the devices */
static int sector_size = 512;
static int mydrv_open(struct block_device *bdev, fmode_t mode);
static void mydrv_release(struct gendisk *gd, fmode_t mode);
static int mydrv_ioctl(struct block_device *bdev, fmode_t mode,
unsigned int cmd, unsigned long arg);
static int mydrv_getgeo(struct block_device *bdev, struct hd_geometry *geo);
static struct block_device_operations mydrv_ops = {
.owner = THIS_MODULE,
.open = mydrv_open,
.release = mydrv_release,
.ioctl = mydrv_ioctl,
.getgeo = mydrv_getgeo,
};
static struct request_queue *mydrv_queue = NULL;
/* Function to handle requests */
static void mydrv_request(struct request_queue *q);
(3)塊設(shè)備驅(qū)動(dòng)程序的模塊加載及卸載函數(shù)
/* Module initialization */
static int __init mydrv_init(void)
{
int ret = -1;
struct gendisk *disk = NULL;
/* Register block device */
dev_major = register_blkdev(dev_major, "mydrv");
if (dev_major <= 0) {
pr_err("mydrv: block device registration failed\n");
goto err_reg;
}
/* Create request queue */
mydrv_queue = blk_alloc_queue(GFP_KERNEL);
if (!mydrv_queue) {
pr_err("mydrv: request queue creation failed\n");
goto err_queue;
}
/* Set request function */
blk_queue_make_request(mydrv_queue, mydrv_request);
/* Initialize volumes */
if (!init_volumes(&mydrv_queue, &disk)) {
pr_err("mydrv: volume initialization failed\n");
goto err_vols;
}
/* Create block device */
if (!add_disk(disk)) { pr_err("mydrv: disk registration failed\n");
goto err_disk;
}
/* Set block device operations */
disk->fops = &mydrv_ops;
/* Success */
return 0;
/* Error handling */
err_disk:
if (disk) {
del_gendisk(disk);
put_disk(disk);
}
err_vols:
blk_cleanup_queue(mydrv_queue);
err_queue:
unregister_blkdev(dev_major, "mydrv");
err_reg:
return ret;
}
/* Module exit */
static void __exit mydrv_exit(void)
{
unregister_blkdev(dev_major, "mydrv");
blk_cleanup_queue(mydrv_queue);
cleanup_volumes();
}
(4)塊設(shè)備驅(qū)動(dòng)程序的操作函數(shù)
及請(qǐng)求處理函數(shù)。
```c
/* Open operation */
static int mydrv_open(struct block_device *bdev, fmode_t mode)
{
return 0;
}
/* Release operation */
static void mydrv_release(struct gendisk *gd, fmode_t mode)
{
}
/* Control operation */
static int mydrv_ioctl(struct block_device *bdev, fmode_t mode,
unsigned int cmd, unsigned long arg)
{
return -ENOTTY;
}
/* Geometry function */
static int mydrv_getgeo(struct block_device *bdev, struct hd_geometry *geo)
{
struct mydrv_volume *vol = NULL;
int ret = -1;
/* Get volume information */
vol = bdev->bd_disk->private_data;
if (!vol) {
pr_err("mydrv: invalid volume information\n");
goto out;
}
/* Set geometry */
geo->heads = vol->heads;
geo->sectors = vol->sectors;
geo->cylinders = vol->cylinders;
ret = 0;
out:
return ret;
}
/* Request function */
static void mydrv_request(struct request_queue *q)
{
struct request *req = NULL;
struct bio *bio = NULL;
struct mydrv_volume *vol = NULL;
/* Process all requests in the queue */
while ((req = blk_fetch_request(q)) != NULL) {
/* Check request type */
if (req->cmd_type != REQ_TYPE_FS) {
pr_err("mydrv: wrong request type\n");
__blk_end_request_all(req, -EIO);
continue;
}
/* Process all bio requests */
__rq_for_each_bio(bio, req) {
/* Get volume */
vol = bio->bi_bdev->bd_disk->private_data;
if (!vol) {
pr_err("mydrv: invalid volume information\n");
__blk_end_request_all(req, -EIO);
continue;
}
/* Process bio request */
switch (bio_rw(bio)) {
case READ:
mydrv_read(vol, bio);
break;
case WRITE:
mydrv_write(vol, bio);
break;
default:
pr_err("mydrv: wrong I/O operation\n");
__blk_end_request_all(req, -EIO);
break;
}
}
/* End request */
__blk_end_request_all(req, 0);
}
}
三、總結(jié)
塊設(shè)備驅(qū)動(dòng)程序是Linux內(nèi)核中非常重要的組件之一,它負(fù)責(zé)處理塊設(shè)備的讀寫(xiě)操作,為操作系統(tǒng)內(nèi)核和各種應(yīng)用程序提供標(biāo)準(zhǔn)接口。在塊設(shè)備驅(qū)動(dòng)程序的編寫(xiě)過(guò)程中,需要仔細(xì)處理讀、寫(xiě)和I/O請(qǐng)求處理函數(shù)的實(shí)現(xiàn),以實(shí)現(xiàn)塊設(shè)備的最佳操作效率。
希望大家通過(guò)閱讀本文,了解和掌握塊設(shè)備驅(qū)動(dòng)程序的工作原理,進(jìn)一步提高對(duì)Linux內(nèi)核的理解和認(rèn)知。