在Linux移植之make uImage编译过程分析中已经提到了uImage是一个压缩的包并且内含压缩程序,可以进行自解压。自解压完成之后内核代码从物理地址为0x30008000处开始运行。下面分析在进入C之前内核做的一些工作,以下是内核启动过程中打印出来的信息,其中Uncompressing Linux就是在自解压代码。make uImage编译的最后也给出了链接脚本arch/arm/kernel/vmlinux.lds,以及链接的顺序****arch/arm/kernel/head.o 是第一个。
分析arch/arm/kernel/vmlinux.lds可以知道程序入口的地址是stext,并且是.text.head段
277 OUTPUT_ARCH(arm)
278 ENTRY(stext)
291 . = (0xc0000000) + 0x00008000;
292
293 .text.head : {
294 _stext = .;
295 _sinittext = .;
296 *(.text.head)
297 }
打开arch/arm/kernel/head.s。可见内核运行的第一条代码就是第79行的代码,从这条开始分析,首先将CPU设置为管理模式,并且关闭所有中断;然后获得CPU的id。
76 .section ".text.head", "ax" //.text.head段
77 .type stext, %function
78 ENTRY(stext) //入口地址stext
79 msr cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode//确保进入了管理模式
80 @ and irqs disabled //并且禁止中断
81 mrc p15, 0, r9, c0, c0 @ get processor id //获得处理器的CPU id,并且存入 r9中
82 bl __lookup_processor_type @ r5=procinfo r9=cpuid //调用函数,输入参数r9=cpuid。返回值r5=procinfo
83 movs r10, r5 @ invalid processor (r5=0)?//如果不支持当前CPU,则r5=0
84 beq __error_p @ yes, error 'p' //如果r5=0,则打印错误
85 bl __lookup_machine_type @ r5=machinfo //调用函数,r5=返回值machinfo
86 movs r8, r5 @ invalid machine (r5=0)? //如果不支持当前单板,则返回r5=0
87 beq __error_a @ yes, error 'a' //如果r5=0,则打印错误
88 bl __create_page_tables//创建一级页表以建立虚拟地址到物理地址的映射关系,后面再研究
接着调用__lookup_processor_type,它位于arch\arm\kernel\head-common.S。它的功能是比较当前CPU的id与内核支持的CPU的id是否相符合。这段代码在.proc.info.init段中从__proc_info_begin开始到__proc_info_end结束,寻找符合当前CPU的ID号的proc_info_list结构
145 .type __lookup_processor_type, %function
146 __lookup_processor_type:
147 adr r3, 3f //r3 = 第178行代码的物理地址
148 ldmda r3, {r5 - r7} //将r3地址开始的3个地址的内容赋给 r5、r6、r7 ;r5=__proc_info_begin,r6=__proc_info_end
149 sub r3, r3, r7 @ get offset between virt&phys//r3=r3-r7,即物理地址与虚拟地址的差值
150 add r5, r5, r3 @ convert virt addresses to//r5=__proc_info_begind对应的物理地址
151 add r6, r6, r3 @ physical address space //r6=__proc_info_end对应的物理地址
152 1: ldmia r5, {r3, r4} @ value, mask//r3、r4等于proc_info_list结构中的cpu_val、cpu_mask
153 and r4, r4, r9 @ mask wanted bits//r4=r4&r9=cpu_mask&传入的cpuid
154 teq r3, r4 //比较
155 beq 2f //如果相等,则找到对应的proc_info_list结构,跳到160行
156 add r5, r5, #PROC_INFO_SZ @ sizeof(proc_info_list)//r5指向下一个proc_info_list结构
157 cmp r5, r6 //是否已经比较完所有proc_info_list
158 blo 1b //没有则继续比较
159 mov r5, #0 @ unknown processor//比较完毕,但是没有找到匹配的proc_info_list结构,r5=0
160 2: mov pc, lr//返回,返回的值为r5=proc_info_list
176 .long __proc_info_begin
177 .long __proc_info_end
178 3: .long .//.表示当前这条代码链接后的虚拟地址
179 .long __arch_info_begin
180 .long __arch_info_end
其中__proc_info_begin、__proc_info_end被定义在arch\arm\kernel\vmlinux.lds中,它的意思是内核源码中有被定义为.proc.info.init的内容,它的起始地址是__proc_info_begin,结束地址为__proc_info_end。
299 .init : { /* Init code and data */
230 *(.init.text)
231 _einittext = .;
232 __proc_info_begin = .;
233 *(.proc.info.init)
234 __proc_info_end = .;
接着看到proc_info_list结构的内容,它被定义在include\asm-arm\Procinfo.h中
29 struct proc_info_list {
30 unsigned int cpu_val;
31 unsigned int cpu_mask;
32 unsigned long __cpu_mm_mmu_flags; /* used by head.S */
33 unsigned long __cpu_io_mmu_flags; /* used by head.S */
34 unsigned long __cpu_flush; /* used by head.S */
35 const char *arch_name;
36 const char *elf_name;
37 unsigned int elf_hwcap;
38 const char *cpu_name;
39 struct processor *proc;
40 struct cpu_tlb_fns *tlb;
41 struct cpu_user_fns *user;
42 struct cpu_cache_fns *cache;
43 };
接着找到对于当前内核支持的proc_info_list 定义,它在arch\arm\mm\proc-arm920.S 中。对于S3C2410、S3C2440芯片来说CPU ID都是0x41129200。cpu_val的值为0x41009200、cpu_mask的值为0xff00fff0,刚好匹配。
.section ".proc.info.init", #alloc, #execinstr
448 .type __arm920_proc_info,#object
449 __arm920_proc_info:
450 .long 0x41009200//cpu_val值
451 .long 0xff00fff0//cpu_mask值
452 .long PMD_TYPE_SECT | \
453 PMD_SECT_BUFFERABLE | \
454 PMD_SECT_CACHEABLE | \
455 PMD_BIT4 | \
456 PMD_SECT_AP_WRITE | \
457 PMD_SECT_AP_READ
458 .long PMD_TYPE_SECT | \
459 PMD_BIT4 | \
460 PMD_SECT_AP_WRITE | \
461 PMD_SECT_AP_READ
462 b __arm920_setup
463 .long cpu_arch_name
464 .long cpu_elf_name
465 .long HWCAP_SWP | HWCAP_HALF | HWCAP_THUMB
466 .long cpu_arm920_name
467 .long arm920_processor_functions
468 .long v4wbi_tlb_fns
469 .long v4wb_user_fns
470 #ifndef CONFIG_CPU_DCACHE_WRITETHROUGH
471 .long arm920_cache_fns
472 #else
473 .long v4wt_cache_fns
474 #endif
475 .size __arm920_proc_info, . - __arm920_proc_info
继续回到arch/arm/kernel/head.s往下分析,看到第83行,调用完__lookup_processor_type后r5的值变为执向找到的proc_info_list 结构的地址。所以第83行与第84行比较r5是否为0,如果为0说明没有找到符合当前CPU的ID号,则打印错误。接着到85行,调用__lookup_machine_type,它同样位于arch\arm\kernel\head-common.S中,它的功能是比较当前单板的id与内核支持的单板的id是否相符合。这段代码在.arch.info.init段中从__arch_info_begin开始到__arch_info_end结束,寻找符合当前单板的ID号的machine_desc结构
176 .long __proc_info_begin
177 .long __proc_info_end
178 3: .long .//.表示当前这条代码链接后的虚拟地址
179 .long __arch_info_begin
180 .long __arch_info_end
193 .type __lookup_machine_type, %function
194 __lookup_machine_type:
195 adr r3, 3b //r3=第178行的物理地址
196 ldmia r3, {r4, r5, r6} //r4=r3。r5=__proc_info_end,r6=__proc_info_begin,取得的是虚拟地址
197 sub r3, r3, r4 @ get offset between virt&phys//r3=r3-r4,取得物理地址与虚拟地址的偏差
198 add r5, r5, r3 @ convert virt addresses to//r5=r5+r3,取得物理地址__proc_info_end
199 add r6, r6, r3 @ physical address space //r6=r6+r3,取得物理地址__proc_info_begin
200 1: ldr r3, [r5, #MACHINFO_TYPE] @ get machine type //r3=取得单板的编号
201 teq r3, r1 @ matches loader number?//比较r3与r1是否相等,即linux是否支持uboot传入的单板
202 beq 2f @ found //如果相等,则跳到207行,找到支持的单板,返回
203 add r5, r5, #SIZEOF_MACHINE_DESC @ next machine_desc//r5执向下一个machine_desc结构
204 cmp r5, r6 //是否已经比较完machine_desc结构?
205 blo 1b //如果没有比较完,则跳到200行继续比较
206 mov r5, #0 @ unknown machine //如果所有machine_desc都比较完了,r5=0
207 2: mov pc, lr //返回
其中__arch_info_begin、__arch_info_end被定义在arch\arm\kernel\vmlinux.lds中,它的意思是内核源码中有被定义为.arch.info.init的内容,它的起始地址是__arch_info_begin,结束地址为__arch_info_end。
305 __arch_info_begin = .;
306 *(.arch.info.init)
307 __arch_info_end = .;
接着看到machine_desc结构的内容,它被定义在include\asm-arm\mach\Arch.h 中
17 struct machine_desc {
18 /*
19 * Note! The first four elements are used
20 * by assembler code in head-armv.S
21 */
22 unsigned int nr; /* architecture number */ //单板的编号,是从内核传过来的编号 r1
23 unsigned int phys_io; /* start of physical io */
24 unsigned int io_pg_offst; /* byte offset for io
25 * page tabe entry */
26
27 const char *name; /* architecture name */
28 unsigned long boot_params; /* tagged list *///boo传过来的tag标记的位置,也是从内核传过来的 r2
29
30 unsigned int video_start; /* start of video RAM */
31 unsigned int video_end; /* end of video RAM */
32
33 unsigned int reserve_lp0 :1; /* never has lp0 */
34 unsigned int reserve_lp1 :1; /* never has lp1 */
35 unsigned int reserve_lp2 :1; /* never has lp2 */
36 unsigned int soft_reboot :1; /* soft reboot */
37 void (*fixup)(struct machine_desc *,
38 struct tag *, char **,
39 struct meminfo *);
40 void (*map_io)(void);/* IO mapping function *///IO映射函数,移植时需要关注
41 void (*init_irq)(void);
42 struct sys_timer *timer; /* system tick timer */
43 void (*init_machine)(void);
44 };
接着需要找到对于当前内核支持的machine_desc定义,在include\asm-arm\mach\Arch.h 中有如下宏定义,它表示在.arch.info.init段存入一个machine_desc 的结构体,名称为
__mach_desc_type,结构体内.nr、.name初始化为MACH_TYPE_type、_name
50 #define MACHINE_START(_type,_name) \
51 static const struct machine_desc __mach_desc_##_type \
52 __used \
53 __attribute__((__section__(".arch.info.init"))) = { \
54 .nr = MACH_TYPE_##_type, \
55 .name = _name,
56
57 #define MACHINE_END \
58 };
接着找调用MACHINE_START这个宏的文件,在arch\arm\mach-s3c2440\Mach-smdk2440.c 找到了,所以单板的ID为MACH_TYPE_S3C2440,它被定义在include\asm-arm\Mach-types.h中
#define MACH_TYPE_S3C2440 362。与UBOOT传入的参数相符合。
339 MACHINE_START(S3C2440, "SMDK2440")
340 /* Maintainer: Ben Dooks <ben@fluff.org> */
341 .phys_io = S3C2410_PA_UART,
342 .io_pg_offst = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,
343 .boot_params = S3C2410_SDRAM_PA + 0x100,
344
345 .init_irq = s3c24xx_init_irq,
346 .map_io = smdk2440_map_io,
347 .init_machine = smdk2440_machine_init,
348 .timer = &s3c24xx_timer,
349 MACHINE_END
继续来看MACHINE_START(S3C2440, "SMDK2440")这个宏,在里面有许多和开发板相关的设置,比如说smdk2440_map_io,它被定义在arch\arm\mach-s3c2440\Mach-smdk2440.c中,在Linux移植之移植步骤中提到过想要移植成功,必须修改327行代码,将晶振的设置改为12000000。还有其它的一些配置就不一一列举了。
324 static void __init smdk2440_map_io(void)
325 {
326 s3c24xx_init_io(smdk2440_iodesc, ARRAY_SIZE(smdk2440_iodesc));
327 s3c24xx_init_clocks(12000000);//根据开发板合适的晶振配置
328 s3c24xx_init_uarts(smdk2440_uartcfgs, ARRAY_SIZE(smdk2440_uartcfgs));
329 }
回到arch/arm/kernel/head.s接着往下看,86、87行判断__lookup_machine_type是否成功找到支持单板的machine_desc结构,如果没找到则打印错误,88行是用来创建一级页表以建立虚拟地址到物理地址的映射关系,这里不详细分析。
继续往下看,看到100行,其中r10的值为__arm920_proc_info所在地址,PROCINFO_INITFUNC为proc_info_list结构体的偏移量,具体为__cpu_flush,对应到__arm920_proc_info结构体内,pc的值就是b __arm920_setup这条语句所在地址,即执行b __arm920_setup这条指令,__arm920_setup做一些MMU相关的初始化,在arch\arm\mm\proc-arm920.S中,这里不做细究。
97 ldr r13, __switch_data @ address to jump to after//r13是堆栈寄存器sp
98 @ mmu has been enabled
99 adr lr, __enable_mmu @ return (PIC) address //100行设置完成之后在使能MMU
100 add pc, r10, #PROCINFO_INITFUNC//调用__arm920_setup函数,应该跟MMU相关,后面再研究
b __arm920_setup执行完毕返回之后执行的是arch/arm/kernel/head.s下的__enable_mmu 。
152 .type __enable_mmu, %function
153 __enable_mmu:
.....
174 b __turn_mmu_on
187 .align 5
188 .type __turn_mmu_on, %function
189 __turn_mmu_on:
190 mov r0, r0
191 mrc p15, 0, r3, c0, c0, 0 @ read id reg
192 mov r3, r3
193 mov r3, r3
194 mov pc, r13//设置完MMU之后跳转到__switch_data执行
__enable_mmu 执行完之后进入__switch_data执行,注意这时候的运行地址已经是初始化MMU之后的虚拟地址了。从15-24行可以看出pc=__mmap_switched,__mmap_switched的主要工作是将processor_id与__machine_arch_type初始化为当前MCU的编号与单板的编号
14 .type __switch_data, %object
15 __switch_data:
16 .long __mmap_switched
17 .long __data_loc @ r4
18 .long __data_start @ r5
19 .long __bss_start @ r6
20 .long _end @ r7
21 .long processor_id @ r4//之前找到的符合当前MCU的__arm920_proc_info结构体
22 .long __machine_arch_type @ r5//之前找到的符合单板的__mach_desc_S3C2440结构体
23 .long cr_alignment @ r6
24 .long init_thread_union + THREAD_START_SP @ sp
25
26 /*
27 * The following fragment of code is executed with the MMU on in MMU mode,
28 * and uses absolute addresses; this is not position independent.
29 *
30 * r0 = cp#15 control register
31 * r1 = machine ID
32 * r9 = processor ID
33 */
34 .type __mmap_switched, %function
35 __mmap_switched://虚拟地址已经可以使用
36 adr r3, __switch_data + 4//r3=__data_loc所在的地址
37
38 ldmia r3!, {r4, r5, r6, r7}//r4=__data_loc所在地址;r5=__data_start所在地址依次类推 r3=__switch_data+4*4
39 cmp r4, r5 @ Copy data segment if needed //检查是否有__data_loc段r4=r5说明没有__data_loc
40 1: cmpne r5, r6
41 ldrne fp, [r4], #4
42 strne fp, [r5], #4
43 bne 1b
44
45 mov fp, #0 @ Clear BSS (and zero fp)//清0BSS段
46 1: cmp r6, r7
47 strcc fp, [r6],#4
48 bcc 1b
49
50 ldmia r3, {r4, r5, r6, sp}//r4=processor_id、r5=__machine_arch_type、r6=cr_alignment、sp=init_thread_union + THREAD_START_SP
51 str r9, [r4] @ Save processor ID//processor_id=r9 = proc_info_list.cpu_val = 0x41009200
52 str r1, [r5] @ Save machine type//__machine_arch_type=r1 = machine_desc .nr = MACH_TYPE_S3C2440 = 362
53 bic r4, r0, #CR_A @ Clear 'A' bit
54 stmia r6, {r0, r4} @ Save control register values
55 b start_kernel//跳转到start_kernel C函数
最终执行b start_kernel,跳到C函数,这是第二阶段的内容。