自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux Kernel編譯和鏈接中的linker script語法詳解

移動(dòng)開發(fā) Android
先要講講這個(gè)問題是怎么來的。(咱們?cè)诜治鲆粋€(gè)技術(shù)的時(shí)候,先要考慮它是想解決什么問題,或者學(xué)習(xí)新知識(shí)的時(shí)候,要清楚這個(gè)知識(shí)的目的是什么)。

先要講講這個(gè)問題是怎么來的。(咱們?cè)诜治鲆粋€(gè)技術(shù)的時(shí)候,先要考慮它是想解決什么問題,或者學(xué)習(xí)新知識(shí)的時(shí)候,要清楚這個(gè)知識(shí)的目的是什么)。

我在編譯內(nèi)核的時(shí)候,發(fā)現(xiàn)arch/arm/kernel目錄下有一個(gè)這樣的文 件:vmlinux.lds.S。第一眼看上去,想想是不是匯編文件呢?打開一看,好像不是。那它是干嘛的?而且前面已經(jīng)說過,make V=1的時(shí)候,發(fā)現(xiàn)這個(gè)文件的用處在ld命令中,即ld -T vmlinux.lds.S,好像是鏈接命令用的,如下所示

如arm-linux-ld -EL -p --no-undefined -X --build-id -o vmlinux -T arch/arm/kernel/vmlinux.lds。man ld,得到-T的意思是:為ld指定一個(gè)Linker script,意思是ld根據(jù)這個(gè)文件的內(nèi)容來生成最終的二進(jìn)制。

也許上面這個(gè)問題,你從沒關(guān)注過,但是在研究內(nèi)核代碼的時(shí)候,常常有地方說“ __init宏會(huì)在最后的模塊中生成一個(gè)特定的section,然后kernel加載的時(shí)候,尋找這個(gè)section中的函數(shù)”,說白了,上面這句話就是 說最后生成的模塊中,有一個(gè)特定的section,這又是什么東西?

好吧,希望上面的問題勾起你的好奇心。下面我們來掃盲,最后會(huì)給一個(gè)鏈接地址,各看官可以去那深造。
一 section是什么?
好吧,我們需要解釋一下平時(shí)編譯鏈接生成的二進(jìn)制可執(zhí)行程序(比如說ELF,EXE也行),so或者dll,內(nèi)核(非壓縮的,參加本系列第一節(jié)內(nèi)容、vmlinux),或者ko是怎么組織的。
其實(shí),大家或多或少都知道這些二進(jìn)制中包括有什么text/bss/data節(jié)(也叫section)。text節(jié)存儲(chǔ)的是代碼、data存儲(chǔ)的是已經(jīng)初始化的靜態(tài)變量、bss節(jié)存儲(chǔ)的是未初始化的什么東西...
上面的東西我就不細(xì)究了。反正一點(diǎn),一個(gè)二進(jìn)制,最終會(huì)包含很多section。那么,為什么section叫text/bss/data,能叫別的名字嗎?
OK,可以。但是你得告訴ld,那么這些內(nèi)容就通過-T選項(xiàng)指定一個(gè)linker script就行了。這些內(nèi)容我們放到后面的實(shí)例中來介紹。
(再三強(qiáng)調(diào),咱們?cè)诶碚撋现皇菕伌u引玉,希望有興趣的看官自己研究,注意和我們分享你的成果就行了。)
二 link script基礎(chǔ)知識(shí)介紹
linker script中的語法是linker command language(很簡單的language,大家不用害怕...)。那么LS的目的是什么呢?
  • LS描述輸入文件(也就是gcc -c命令產(chǎn)生的.o文件即object文件)中的section最終如何對(duì)應(yīng)到一個(gè)輸出文件。這個(gè)其實(shí)好理解,例如一個(gè)elf由三個(gè).o文件構(gòu)成,每 個(gè).o文件都有text/data/bss段,但最終的那一個(gè)elf就會(huì)將三個(gè)輸入的.o文件的段合并到一起。
好了,下面我們介紹一些基本知識(shí):
  • ld的功能是將input文件組裝成一個(gè)output文件。這些文件內(nèi)部的都有特殊 的組織結(jié)構(gòu),這種結(jié)構(gòu)被叫做object file format。每一個(gè)文件叫做object file(這可能就是.o文件的來歷吧。哈哈),輸出文件也叫可執(zhí)行文件(an executable),但是對(duì)于ld來說,它也是一種object文件。那么Object文件有什么特殊的地方呢?恩,它內(nèi)部組織是按照 section(段、或者節(jié),以后不再區(qū)分二者)來組織的。一句話,object文件內(nèi)部包含段......
  • 每個(gè)段都有名字和size。另外,段內(nèi)部還包含一些數(shù)據(jù), 這些數(shù)據(jù)叫做section contents,以后稱段內(nèi)容。每個(gè)段有不同的屬性。例如text段標(biāo)志為可加載(loadable),表示該段內(nèi)的contents在運(yùn)行時(shí)候(當(dāng)然 指輸出文件執(zhí)行的時(shí)候)需要加載到內(nèi)存中。另外一些段中沒有contents,那么這些段標(biāo)示為allocatable,即需要分配一些內(nèi)存(有時(shí)候這些 內(nèi)存會(huì)被初始化成0,這里說的應(yīng)該是BSS段。BSS段在二進(jìn)制文件中沒有占據(jù)空間,即磁盤上二進(jìn)制文件的大小比較小,但是加載到內(nèi)存后,需要為BSS段 分配內(nèi)存空間。),還有一些段屬于debug的,這里包含一些debug信息。
  • 既然需要加載到內(nèi)存中,那么加載到內(nèi)存的地址是什么 呢?loadable和allocable的段都有兩個(gè)地址,VMA:虛擬地址,即程序運(yùn)行時(shí)候的地址,例如把text段的VMA首地址設(shè)置為 0x800000000,那么運(yùn)行時(shí)候的首地址就是這個(gè)了。另外還有一個(gè)LMA,即Load memory address。這個(gè)地址是section加載時(shí)的地址。暈了吧?二者有啥區(qū)別?一般情況下,VMA=LMA。但也有例外。例如設(shè)置某數(shù)據(jù)段的LMA在 ROM中(即加載的時(shí)候拷貝到ROM中),運(yùn)行的時(shí)候拷貝到RAM中,這樣LMA和VMA就不同了。---------》很難搞懂不是?這種方法用于初始 化一些全局變量,基于那種ROM based system。(問一個(gè)問題,run的時(shí)候,怎么根據(jù)section中的VMA進(jìn)行相應(yīng)設(shè)置啊??以后可能需要研究下內(nèi)核中關(guān)于execve實(shí)現(xiàn)方面的內(nèi) 容了)。關(guān)于VMA和LMA,大家通過objdump -h選項(xiàng)可以查看。
三 簡單例子
下面來一個(gè)簡單例子,

 SECTIONS
 {
       . = 0x10000;
       .text : { *(.text) }
       . = 0x8000000;
       .data : { *(.data) }
       .bss : { *(.bss) }
 }
  • SECTIONS是LS語法中的關(guān)鍵command,它用來描述輸出文件的內(nèi)存布局。例如上例中就含text/data/bss三個(gè)部分(實(shí)際上text/data/bss才是段,但是SECTIONS這個(gè)詞在LS中是一個(gè)command,希望各位看官要明白)。
  • .=0x10000; 其中的.非常關(guān)鍵,它代表location counter(LC)。意思是.text段的開始設(shè)置在0x10000處。這個(gè)LC應(yīng)該指的是LMA,但大多數(shù)情況下VMA=LMA。
  • .text:{*(.text)},這個(gè)表示輸出文件的.text段內(nèi)容由所有輸入文件(*)的.text段組成。組成順序就是ld命令中輸入文件的順序,例如1.obj,2.obj......
  • 此后,由來了一個(gè).=0x800000000;。如果沒有 這個(gè)賦值的,那么LC應(yīng)該等于0x10000+sizeof(text段),即LC如果不強(qiáng)制指定的話,它默認(rèn)就是上一次的LC+中間section的長 度。還好,這里強(qiáng)制指定LC=0X800000000.表明后面的.data段的開始位于這個(gè)地址。
  • .data和后面的.bss表示分別有輸入文件的.data和.bss段構(gòu)成。
你看,我們從這個(gè)LC文件中學(xué)到了什么?
恩,我們可以任意設(shè)置各個(gè)段的LMA值。當(dāng)然,絕大部分情況,我們不需要有自己的LS來控制輸出文件的內(nèi)存布局。不過LK(linux kernel)可不一樣了......
 
四 霸王硬上弓---vmlinux.lds.S分析
 
OK,有了上面的基礎(chǔ)知識(shí),下面我們霸王硬上弓,直接分析arch/arm/kernel/vmlinux.lds.S.雖然最終鏈接用的是vmlinux.lds,但是那個(gè)文件
由vmlinux.lds.S(這是一個(gè)匯編文件)得到,
arm-linux-gcc -E -Wp,-MD,arch/arm/kernel/.vmlinux.lds.d -nostdinc ...... -D__KERNEL__ -mlittle-endian ......
-DTEXT_OFFSET=0x00008000 -P -C -Uarm -D__ASSEMBLY__ -o arch/arm/kernel/vmlinux.lds     arch/arm/kernel/vmlinux.lds.S
所以,我們直接分析vmlinux.lds好了。
/*
   一堆注釋,這里就不再貼上了,另外,增加//號(hào)做為注釋標(biāo)識(shí)
 * Convert a physical address to a Page Frame Number and back
 */
//OUTPUT_ARCH是LS語法中的COMMAND,用來指定輸出文件的machine arch。objdump -f可查詢所有支持的machine。另外
//這些東西涉及到一種叫BFD的。各位看官可以自己搜索下BFD的內(nèi)容。
//下面這 表示輸出文件基于ARM架構(gòu)
OUTPUT_ARCH(arm)   
//ENTRY也是一個(gè)command,用來設(shè)置入口點(diǎn)。這里表示入口點(diǎn)是stext 。根據(jù)LD的描述,入口點(diǎn)的意思就是程序運(yùn)行的第一條指令。內(nèi)核是一個(gè)模塊,大家把他想象
//成一個(gè)運(yùn)行在硬件上的大程序就可以了。而我們的程序又是運(yùn)行在內(nèi)核至上的。比較下Java虛擬機(jī)以及運(yùn)行在其上的Java程序吧......
ENTRY(stext)
//設(shè)置jiffies為jiffies_64
jiffies = jiffies_64;
//定義輸出文件的段
SECTIONS
{
//設(shè)置location count為0xc0008000,這個(gè)好理解吧?內(nèi)核運(yùn)行的地址全在C0000000以上
 . = 0xC0000000 + 0x00008000;
//定義一個(gè).text.head段,由輸入文件中所有.text.head段組成
/*
LS語法中,關(guān)于seciton的定義如下:
section [address] [(type)] :
       [AT(lma)] [ALIGN(section_align)]
       [SUBALIGN(subsection_align)]
       [constraint]
       {
         output-section-command
         output-section-command
         ...
       } [>region] [AT>lma_region] [:phdr :phdr ...] [=fillexp]
其中,address為VMA,而AT命令中的為LMA。一般情況,address不會(huì)設(shè)置,所以它默認(rèn)等于當(dāng)前的location counter
*/
 .text.head : {
/*這個(gè)非常關(guān)鍵,咱們?cè)趦?nèi)核代碼中經(jīng)常能看到一些變量聲明,例如extern int __stext,但是卻找不到在哪定義的
其實(shí)這些都是在lds文件中定義的。這里得說一下編譯鏈接相關(guān)的小知識(shí)。咱們這知道大概即可,具體內(nèi)容可以自己深入研究
假設(shè)C代碼中定義一個(gè)變量 int x = 0;那么
1 編譯器首先會(huì)分配一塊內(nèi)存,用來存儲(chǔ)該變量的值
2 編譯器在程序的symbol表中,創(chuàng)建一項(xiàng),用來存儲(chǔ)這個(gè)變量的地址
例如,上面的 int x = 0,就在symbol表中創(chuàng)建一x項(xiàng),這個(gè)x項(xiàng)指向一塊內(nèi)存,sizeof(int)大小,存儲(chǔ)的值為0。當(dāng)有地方使用這個(gè)x的時(shí)候,編譯器會(huì)生成相應(yīng)的代碼,
首先指向這個(gè)x的內(nèi)存,然后讀取內(nèi)存中的值。
上面的內(nèi)容是C中一個(gè)變量的定義。但是Linker script中也可以定義變量,這時(shí)候只會(huì)生成一個(gè)symbol項(xiàng),但是沒有分配內(nèi)存。。例如_stext=0x100,那么會(huì)
創(chuàng)建一個(gè)symbol項(xiàng),指向0x100的內(nèi)存,但該內(nèi)存中沒有存儲(chǔ)value。所以,我們?cè)贑中使用LS中定義的變量的話,只能取它的地址。下面是一個(gè)例子:
start_of_ROM   = .ROM;
end_of_ROM     = .ROM + sizeof (.ROM) - 1;
start_of_FLASH = .FLASH;
上面三個(gè)變量是在LS中定義的,分別指向.ROM段的開始和結(jié)尾,以及FLASH段的開始?,F(xiàn)在在C代碼中想把ROM段的內(nèi)容拷貝到FLASH段中,下面是C代碼:
extern char start_of_ROM, end_of_ROM, start_of_FLASH;
memcpy (& start_of_FLASH, & start_of_ROM, & end_of_ROM - & start_of_ROM);
注意其中的取地址符號(hào)&。C代碼中只能通過這種方式來使用LS中定義的變量. start_of_ROM這個(gè)值本身是沒有意義的,只有它的地址才有意義。因?yàn)樗闹禌]有初始化。
地址就指向.ROM段的開頭。
說白了,LS中定義的變量其實(shí)就是地址,即_stext=0x100就是C代碼中的一個(gè)地址 int *_stext=0x100。明白了?
最終的ld中會(huì)分配一個(gè)slot,然后存儲(chǔ)x的地址。也就是說,ld知道這些勾當(dāng)。那么當(dāng)然我們?cè)贚S中
也可以定義一個(gè)變量,然后在C中使用了。所以下面這句話實(shí)際上定義了一個(gè)_stext變量。在C中通過extern就可以引用了。但是這里有一個(gè)
比較關(guān)鍵的問題。C中定義的x=0,其值被初始化為0了。也就是slot...待補(bǔ)充
*/
  _stext = .;.
  _sinittext = .;
  *(.text.head)
 }
//定義.init段,由所有的.init.text/.cpuinit.text/.meminit.text組成
//這時(shí)的LC的值為.init的開始
 .init : { /* Init code and data        */
   *(.init.text) *(.cpuinit.text) *(.meminit.text)
//定義一個(gè)變量 _einitext,它的值為當(dāng)前的LC,即.init的初值+*(.init.text) *(.cpuinit.text) *(.meminit.text)的大小。也就是說變量
//_einitext標(biāo)示一個(gè)結(jié)尾。
  _einittext = .;
//下面這個(gè)變量 __proc_info_begin標(biāo)示一個(gè)開頭 
  __proc_info_begin = .;
   *(.proc.info.init)  //所有.proc.info.init段內(nèi)容在這
  __proc_info_end = .;//下面這個(gè)變量 __proc_info_end標(biāo)示結(jié)尾,它和__proc_info_begin變量牢牢得把輸出文件.proc.info.init的內(nèi)容卡住了。
//有了上面begin和end的介紹,后面就簡單了,大部分都是一個(gè)begin+end來卡住一段內(nèi)容。根據(jù)前面的介紹,begin和end又可以在C程序中引用
//也就是我們通過Begin+end,就可以獲得卡住的內(nèi)容了。例如我們把一些初始化的函數(shù)指針放到一個(gè)begin和end中。然后通過一個(gè)循環(huán),不就是
//可以調(diào)用這些函數(shù)了么。最后我們就來個(gè)例子介紹下。
  __arch_info_begin = .;
   *(.arch.info.init)
  __arch_info_end = .;
  __tagtable_begin = .;
   *(.taglist.init)
  __tagtable_end = .;
  . = ALIGN(16);
  __setup_start = .;
   *(.init.setup)
  __setup_end = .;
  __early_begin = .;
   *(.early_param.init)
  __early_end = .;
  __initcall_start = .;
   *(.initcallearly.init)
__early_initcall_end = .;
    *(.initcall0.init) *(.initcall0s.init) *(.initcall1.init) *(.initcall1s.init) *(.initcall2.init) *(.initcall2s.init) *(.initcall3.init) *(.initcall3s.init) *(.initcall4.init) *(.initcall4s.init) *(.initcall5.init) *(.initcall5s.init) *(.initcallrootfs.init) *(.initcall6.init) *(.initcall6s.init) *(.initcall7.init) *(.initcall7s.init)
  __initcall_end = .;
  __con_initcall_start = .;
   *(.con_initcall.init)
  __con_initcall_end = .;
  __security_initcall_start = .;
   *(.security_initcall.init)
  __security_initcall_end = .;
  . = ALIGN(32);//ALIGN,表示對(duì)齊,即這里的Location Counter的位置必須按32對(duì)齊
  __initramfs_start = .;   //ramfs的位置
   usr/built-in.o(.init.ramfs)
  __initramfs_end = .;
  . = ALIGN(4096); //4K對(duì)齊
  __per_cpu_load = .;
  __per_cpu_start = .;
   *(.data.percpu.page_aligned)
   *(.data.percpu)
   *(.data.percpu.shared_aligned)
  __per_cpu_end = .;
  __init_begin = _stext;
  *(.init.data) *(.cpuinit.data) *(.cpuinit.rodata) *(.meminit.data) *(.meminit.rodata)
  . = ALIGN(4096);
  __init_end = .;
 }
//DISACARD是一個(gè)特殊的section,表示符合這個(gè)條件的輸入段都不會(huì)寫到輸出段中,也就是輸出文件中不包含下列段
 /DISCARD/ : { /* Exit code and data        */
  *(.exit.text) *(.cpuexit.text) *(.memexit.text)
  *(.exit.data) *(.cpuexit.data) *(.cpuexit.rodata) *(.memexit.data) *(.memexit.rodata)
  *(.exitcall.exit)
  *(.ARM.exidx.exit.text)
  *(.ARM.extab.exit.text)
 }
//省略部分內(nèi)容
//ADDR為內(nèi)置函數(shù),用來返回VMA的
/*
這里舉個(gè)小例子,大家看看VMA和LMA到底有什么作用
SECTIONS
       {
       .text 0x1000 : { *(.text) _etext = . ; }  /.text段的VMA為0x1000,而且LMA=VMA
       .mdata 0x2000 : //.mdata段的VMA為0x2000,但是它的LMA卻在.text段的結(jié)尾
         AT ( ADDR (.text) + SIZEOF (.text) )
         { _data = . ; *(.data); _edata = . ; }
       .bss 0x3000 :
         { _bstart = . ; *(.bss) *(COMMON) ; _bend = . ;}
     }
看到了么?.mdata段運(yùn)行的時(shí)候在0x2000,但是數(shù)據(jù)load地址卻在.text段后,所以運(yùn)行的時(shí)候需要把.mdata段內(nèi)容拷貝過去。
 extern char _etext, _data, _edata, _bstart, _bend;
     char *src = &_etext;  //_etext為.text端的末尾 VMA地址,但同時(shí)也是.mdata段LMA的開始,有LS種的AT指定
     char *dst = &_data;  //_data為mdata段的VMA,現(xiàn)在需要把LMA地址開始的內(nèi)容拷貝到VMA開始的地方

     /* ROM has data at end of text; copy it. */
     while (dst < &_edata)
       *dst++ = *src++;   //拷貝....明白了?不明白的好好琢磨

     /* Zero bss. */
     for (dst = &_bstart; dst< &_bend; dst++)
       *dst = 0;  //初始化數(shù)據(jù)區(qū)域
 
*/
 .rodata : AT(ADDR(.rodata) - 0) {
  __start_rodata = .; 
  *(.rodata) *(.rodata.*) *(__vermagic) *(__markers_strings) *(__tracepoints_strings) 
  } 
  .rodata1 : AT(ADDR(.rodata1) - 0) { 
  *(.rodata1) 
  } 
 ......//省略部分內(nèi)容
  _edata_loc = __data_loc + SIZEOF(.data);
 .bss : {
  __bss_start = .; /* BSS                */
  *(.bss)
  *(COMMON)
  _end = .;
 }
     /* Stabs debugging sections.    */
 .stab 0 : { *(.stab) }
 .stabstr 0 : { *(.stabstr) }
 .stab.excl 0 : { *(.stab.excl) }
 .stab.exclstr 0 : { *(.stab.exclstr) }
 .stab.index 0 : { *(.stab.index) }
 .stab.indexstr 0 : { *(.stab.indexstr) }
 .comment 0 : { *(.comment) }
}
//ASSERT是命令,如果第一個(gè)參數(shù)為0,則打印第二個(gè)參數(shù)的信息(也就是錯(cuò)誤信息),然后ld命令退出。
ASSERT((__proc_info_end - __proc_info_begin), "missing CPU support")
ASSERT((__arch_info_end - __arch_info_begin), "no machine record defined")
 
五  內(nèi)核代碼中使用LS中定義的變量
咱們看一個(gè)小例子
[-->init/main.c]
extern initcall_t __initcall_start[], __initcall_end[], __early_initcall_end[]; //這幾個(gè)值在LS中定義。大家可以在上面搜索下
static void __init do_initcalls(void)
{
    initcall_t *call;
    //上面已經(jīng)定義成數(shù)組了,所以下面這些變量直接取的就是指針,和上面例子中使用&一個(gè)意思,反正不能用value
    for (call = __early_initcall_end; call < __initcall_end; call++)
        do_one_initcall(*call);

    /* Make sure there is no pending stuff from the initcall sequence */
    flush_scheduled_work();
}
六 總結(jié)
關(guān)于LS的詳細(xì)文檔,見下面的網(wǎng)址:
上面文檔寫得比較粗,但大家知道兩點(diǎn)即可:
  1. LK源碼中那些找不到來源的變量是怎么來的---》在LS定義。
  2. VMA和LMA是怎么回事。

 

責(zé)任編輯:張葉青 來源: 博客園
相關(guān)推薦

2010-02-25 15:11:48

Linux Makef

2010-03-01 16:40:40

Linux Makef

2010-02-24 16:01:39

Linux Makef

2020-06-01 19:00:42

Linux軟鏈接硬鏈接

2023-11-15 08:27:46

Linux系統(tǒng)

2009-12-23 10:36:48

Linux操作系統(tǒng)

2022-10-21 08:18:54

Linuxln 命令

2017-01-15 15:27:51

Linux軟連接和硬鏈接

2009-08-03 11:54:34

linux at命令linux at命令詳cron

2021-03-18 11:20:44

Linux kerne漏洞系統(tǒng)

2010-06-30 10:39:45

Linux SNMP

2022-05-18 07:58:21

Linux程序編譯代碼

2019-11-01 11:06:02

Linux操作系統(tǒng)Windows

2019-03-04 08:14:35

LinuxIDBash

2022-09-14 08:03:56

CentOS 7RPMgcc版本

2020-10-13 09:23:57

LinuxKernel調(diào)度器

2010-01-26 09:07:50

2010-01-19 09:23:50

2010-11-11 10:18:59

select into

2023-12-21 13:59:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)