이 글에서는 리눅스 헤더로 부터 넘어온 첫 번째 함수 stext에 대해서 알아볼 것이다.


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16 

ENTRY(stext)
    bl  preserve_boot_args
    bl  el2_setup           // Drop to EL1, w0=cpu_boot_mode
    adrp    x23, __PHYS_OFFSET
    and x23, x23, MIN_KIMG_ALIGN - 1    // KASLR offset, defaults to 0
    bl  set_cpu_boot_mode_flag
    bl  __create_page_tables
    /*
     * The following calls CPU setup code, see arch/arm64/mm/proc.S for
     * details.
     * On return, the CPU will be ready for the MMU to be turned on and
     * the TCR will have been set.
     */
    bl  __cpu_setup         // initialise processor
    b   __primary_switch
ENDPROC(stext)


stext 함수는 여기서 ENTRY라는 마치 함수와 같은 것으로 둘려져 있는데, 여기서 ENTRY는 링커스크립트의 것과는 다르게 리눅스 내에서 매크로로 정의되어 있는 function-like macro일 뿐이다.


2번 째 줄의 preserve_boot_args에 대해서 간략하게 알아보자면, 이전 글의 마지막에서 언급한 적이 있는데, 리눅스는 시작 할 때 몇 개의 값을 전달 받고 시작하게 된다고 언급한 적이 있다. 이 값들이 지금 당장은 쓰이지 않지만 나중에 쓰이기 위해 따로 저장하기 위함이라 볼 수 있다.


1

2

3

4

5

6

7

8

9

10

11

12

13

 preserve_boot_args:
    mov x21, x0             // x21=FDT

    adr_l   x0, boot_args           // record the contents of
    stp x21, x1, [x0]           // x0 .. x3 at kernel entry
    stp x2, x3, [x0, #16]

    dmb sy              // needed before dc ivac with
                        // MMU off

    mov x1, #0x20           // 4 x 8 bytes
    b   __inval_dcache_area     // tail call
ENDPROC(preserve_boot_args)



linux/arch/arm64/kernel/setup.c 에 위치하고 있는 아래의 boot_args에 저장하게 되는 꼴이 된다.

u64 __cacheline_aligned boot_args[4];



사실, 이 글은 딱히 ARM architecture에 국한 된 것은 아니다.


"Alignment가 무엇인가" 대한 글인데.. 살짝 요약하기 전에 바로 본론으로 들어가보도록 한다.



컴퓨터라는 놈은 특히 ARM architecture에서는 무언가를 실행하기 위해서, CPU 바로 옆에 있는 레지스터와 메모리 사이에 읽고 쓰는

연산이 굉장히 많다. 이때 주의깊게 봐야 할 점은 메모리에서, 어떤 주소에서 얼마 만큼 읽어 올 것인가가 주된 내용이다.


아래 그림에서 각 메모리 주소들은 주소를 나타내고 각 주소마다 1byte 만큼을 의미한다.



각각의 예시를 통해서 개발자가 생각하는 컴퓨터의 예상 행동과 실제 컴퓨터의 행동을 비교해보도록 해보자
먼저, 개발자가 생각하는 컴퓨터의 예상 행동은

  • READ 주소0 부터 1byte: 아래 색칠 되어있는 0 부분만 읽어오는 것

  • READ 주소3 부터 2byte: 아래 색칠되어있는 3 그리고 4를 읽어오는 것
  • READ 주소3 부터 4byte: 아래 색칠되어있는 3, 4, 5 그리고 6를 읽어오는 것


하지만, 실제 컴퓨터의 동작은 프로그래머가 생각하는 방식으로 동작하지 않고 읽거나 쓸 때 Chunk 단위로 동작하는데 이 단위는 CPU에 따라 다르다. 예를 들어 32bit architecutre에서는 32bit chunk 단위로 움직이고, 64bit architecture에서는 64bit chunk 단위로 움직이게 된다. 즉,

  • READ 주소0 부터 1byte: 0 번째 byte를 읽기 위해서 0,1,2 그리고 3번째 byte를 모두 읽고, 그 중 0번 째 byte 값만 다시 OR 연산을 통해
                                             해당 0 번째 byte만을 결과로 갖는다.
  • READ 주소3 부터 2byte: 3 번째 부터 2 byte를 읽기 위해서 0,1,2,3 그리고 4,5,6,7 번째 byte를 모두 읽고, 그 중 3번 째, 4번째 byte 값만 다시
                                            OR 연산을 통해 결과로 갖는다
  • READ 주소3 부터 4byte: 3 번째 부터 4 byte를 읽기 위해서 0,1,2,3 그리고 4,5,6,7 번째 byte를 모두 읽고, 그 중 3,4,5,6번 째 byte 값만 다시 OR
                                             연산을 통해 결과로 갖는다.

 이처럼, 프로그래머가 읽고 싶은 번째부터 몇 개의 byte만을 읽기 위해서 실제로는 chunk 단위로 읽어 들여야 하다 보니 생각치 못한 오버헤드가 생긴다. 그래서 CPU가 자체적으로 이렇게 오버헤드가 생기지 않게 하기 위해서, Alignment check를 통해서 자체적으로 오버헤드를 줄일 수 있게 해 놓았다.(읽고자 하는 단위와, 주소를 통해서 Alignment를 체크한다.)




 Memory Access

 Alignment (8bit)

 Alignment (16bit)

 Alignment (32bit)

 Alignment (64bit)

 0x0000_0000

 Aligned

 Aligned

 Aligned

 Aligned

 0x0000_0001

 Aligned

 Non-Aligned

 Non-Aligned

 Non-Aligned

 0x0000_0002

 Aligned

 Aligned

 Non-Aligned

 Non-Aligned

 0x0000_0003

 Aligned

 Non-Aligned

 Non-Aligned

 Non-Aligned

 0x0000_0004

 Aligned

 Aligned

 Aligned

 Non-Aligned

 0x0000_0005

 Aligned

 Non-Aligned

 Non-Aligned

 Non-Aligned

 0x0000_0006

 Aligned

 Aligned

 Non-Aligned

 Non-Aligned

 0x0000_0007

 Aligned

 Non-Aligned

 Non-Aligned

Non-Aligned

 0x0000_0008

 Aligned

 Aligned

 Aligned

 Aligned




위에 테이블과 같이 해당 메모리는 접근 할 때, 위에 표를 참조하여 Alignment를 체크하고 올바르지 않은 접근을 하게 되면 Alignment Fault를 발생시킨다.



















'전공공부 > ARM' 카테고리의 다른 글

ARM Relocations (adrp)  (0) 2020.10.18
[링커스크립트] 지시어 ENTRY  (0) 2019.02.12
GICv3 LPI, ITS  (0) 2018.07.18
interrupt status - level sensitive  (0) 2018.07.17
ARMv8 HPPIR/IAR, AHPPIR/AIAR  (0) 2018.03.27
이 글에서는 리눅스 커널이 빌드 된 후, 커널 이미지의 헤더에 대해서 알아보도록 한다.

임베디드 환경(통상 ARM Architecture)에서,리눅스 커널과 같은 운영체제는 메모리에 로드가 된 후 실행된다.
그렇다면 여기서!, 드는 질문 2가지?!
  • 메모리에 적재시켜주는데... 메모리 몇 번지에 로드시켜야 하는가?
  • 커널 이미지는 누가 메모리에 로드시켜 주는가?
첫 번째 질문에 대한 대답을 먼저 하면..

 리눅스 커널은 PIC(Position Independent Code)라고 한다. 말 그대로 어느 메모리에 올려도 자기가 알아서 원하는 메모리 주소로 Copy해서 동작할 줄 아는 소프트웨어이다.(물론, 프로그램이 정상적으로 동작 할 수 있는 메모리여야 한다)

 결론적으로, 그래서 딱히 어느 메모리에 로드웨어야 한다 이런것은 없다.얕지만 알고 있는 경험에 의하면, 이미지를 로드하는 메모리 주소가 Align(이 부분에 대해서는 나중에 글을 올릴 예정이다)만 되어있다면 어느 주소에도 동작하는 것을 확인했었다. arm32 에서는 zImage가 원하는 주소에 kernel image를 압축해제 했었다.

두 번째 질문에 대한 대답을 하면..

 커널을 메모리에 올려주는 놈은 부트로더(Bootloader)라고 불리는 소프트웨어가 해준다. 보드를 몇 번 실행해봤다면 흔히 들어봤을 법한 U-boot, LK(Little Kernel), UEFI 이런 놈들이 부트로더에 해당된다.

부트로더도 크게는 First-bootloader, Second-boorloader 로 나눠진다. 간랸히 설명해보면 First-Bootloader는 ATF(ARM Trusted Firmware)에 해당하는 보드를 만드는 vendor사에서 만드는 펌웨어로 보드를 부팅시키는 놈이다.(사실 하나의 소프트웨어가 아니라 여러개로 나뉘어져있다.)
Second-Booloader가 위에서 언급한 부트로더들이다.

이로써 두 개의 질문과 답을 마치고 이어서 이 글의 주제로 넘어와 보면,(지금부터 말하는 부트로더는 Second-Bootloader 이다.)
부트로더는 크게 2개의 역할로 볼 수 있다.(물론 세부적으로는 많은 일들을 하지만 )
첫 번째는 보드의 디바이스, 메모리 초기화. 두 번째는 운영체제 메모리에 적재이다. 그럼 이 때 부트로더는 내가 로드하고 있는 이 운영체제가 어떠한 운영체제인지, 어떠한 프로토콜(운영체제마다 다르겠지만 리눅스에서는 레지스터에 값을 전달해주는 정도를 뜻한다)을 따라주어야 하는지를 먼저 알아야 한다. 그 때 하는 것이 리눅스커널 이미지를 읽어보는 것이다. (전부다는 아니고 처음 시작 부분을 읽어본다)

그럼 리눅스 커널은 부트로더에게 "내가 커널이미지야!" 라고 말해주는 역할로 헤더를 만들어놓았다. Header에 대한 자세한 설명은 참조[1]에 있지만 간략히 설명해보자면 아래와 같이 생겼다.

u32 code0;                            /* Executable code */

u32 code1;                            /* Executable code */

u64 text_offset;                     /* Image load offset, little endian */

u64 image_size;                     /* Effective Image size, little endian */

u64 flags;                               /* kernel flags, little endian */

u64 res2  = 0;                        /* reserved */

u64 res3  = 0;                        /* reserved */

u64 res4  = 0;                        /* reserved */

u32 magic = 0x644d5241;   /* Magic number, little endian, "ARM\x64" */

u32 res5;                               /* reserved (used for PE COFF offset) */


그리고 실제로 커널의 코드를 통해서 이 헤더가 구현되어있는 모습을 보자면, (단 EFI가 아니라 Uboot를 위한 헤더라고 가정한다)


b   stext                                      // branch to kernel start, magic

.long   0                                     // reserved

le64sym _kernel_offset_le       // Image load offset from start of RAM, little-endian

le64sym _kernel_size_le          // Effective size of kernel image, little-endian

le64sym _kernel_flags_le        // Informative flags, little-endian

.quad   0                                            // reserved

.quad   0                                            // reserved

.quad   0                                            // reserved

.ascii  ARM64_IMAGE_MAGIC       // Magic number

.long   0                                             // reserved

                                         <linux/arch/arm64/kernel/head.S>


이 헤더는 리눅스 커널 이미지의 처음 시작 64byte 값이다. 부트로더 코드를 읽어보지는 않았지만, 일단 ARM64_IMAGE_MAGIC("ARM\x64") String값을 읽고 일단 리눅스 커널이라는 것을 알아낸 후 사이즈에 대한 정보를 통해서 메모리에 적재하는 것으로 추정된다. 그리고 메모리에 올린 후 제어권을 리눅스 커널로 넘겨주어야 하는데 이 때 아래와 같은 값을 각각 레지스터에 써서 넘겨준다. (이 때, 제어권을 넘겨준다는 말은 PC값을 이미지의 처음 주소로 assign한다는 의미가 주된 의미지만 필요시 CPU mode를 바꿔줌으로써 넘겨준다.)


- Primary CPU general-purpose register settings
  x0 = physical address of device tree blob (dtb) in system RAM.
  x1 = 0 (reserved for future use)
  x2 = 0 (reserved for future use)
  x3 = 0 (reserved for future use)

(DTB가 무엇인지 대한 설명은 다른 글에서 하도록 한다...하 씨발 쓸거 개 많네)

이 글에서는 리눅스 커널 이미지에는 헤더라는게 왜 있어야 하는지에 대한 배경설명과, 헤더의 모양은 어떠한지 그리고 커널의 실제 헤더의 값은 어떻게 되어있는지에 대해서 보았다.







참조:
[1] linux/Documentation/arm64/booting.txt


+ Recent posts