2022. 8. 3. 17:36ㆍDokhak/컴퓨터
컴파일러 (compiler) 는 특정 프로그래밍 언어로 쓰여 있는 문서를 다른 프로그래밍 언어로
옮기는 언어 번역 프로그램을 말한다. 컴파일러는 고급 프로그래밍 언어를 실행 프로그램으로
만들기 위해 저급 프로그래밍 언어 (ex. 어셈블리어, object 코드, machine code)로 바꾸는 데
사용된다. 원래의 문서를 소스 코드 혹은 원시 코드라고 부르고, 출력된 문서를 목적 코드라고 부른다.
목적 코드는 주로 다른 프로그램이나 하드웨어가 처리하기에 용이한 형태로 출력되지만 사람이 읽을 수
있는 문서 파일이나 그림 파일 등으로 옮기는 경우도 있다.
원시 코드에서 목적 코드로 옮기는 과정을 컴파일이라고 한다. 소스 코드를 컴파일하는 이유는 대부분
사람에게 이해하기 쉬운 형태의 고수준 언어로부터 실행가능한 기계어 프로그램을 만들기 위해서이다.
좁은 의미의 컴파일러는 주로 고수준 언어로 쓰인 소스 코드를 저수준 언어로 번역하는 프로그램을 가리킨다.
컴파일러에서 꼭 지켜야 할 두 가지 조건이 있다.
첫째로, 컴파일러는 옮김의 과정에서 프로그램의 뜻을 보존하여야 한다.
입력받은 프로그램의 의미를 충실히 따라야 한다.
두번째로, 실용적인 면에서, 컴파일러는 입력으로 들어온 프로그램을 어떤 면에서든지 개선해야 한다.
예를 들어, 소스 코드를 기계어로 옮긴다면 기계가 이해할 수 없었던 언어를 기계가 이해할 수 있게
개선한 것이 된다. 같은 언어로 옮긴 경우에는 성능이 개선되는 등의 장점이 있어야 한다. 그렇지 않다면
컴파일을 수행할 이유가 없어진다.
C/C++ 언어와 같은 고급언어는 직접 기계어 코드로 변환한다. 마이크로 프로세서는 각각 다른
기계어 코드를 가지고 있기 때문에 같은 고급언어라도 다른 기계어 코드를 생성해야 한다.
따라서 개발자는 해당 마이크로프로세서에 맞는 컴파일러를 사용해야 한다. (ex. 윈도우, 맥 os)
그러나 자바는 다양한 CPU에서 실행되도록 하는 철학을 가지고 개발되었기 때문에 중간 단계의 코드인
바이트 코드를 생성하고 해석을 해서 실행하는 방식이다. 장점은 한번 컴파일된 바이트 코드는
다른 플랫폼에서 재컴파일 없이 실행할 수 있다. 그러나 단점은 바이트 코드를 해석해서 실행할 프로그램 구조가
필요하고, 직접 기계어 코드를 실행하는 것보다 속도 면에서 느리다.
많은 수의 컴파일러는 다음과 같은 순서를 거쳐 소스 코드를 번역한다.
컴파일러나 프로그래밍 언어의 특성에 따라 일부 단계는 생략되거나 더 세부적인 단계로 나뉠 수 있다.
1) 구문 분석 : 소스 코드 파일을 읽어 개별 문법요소 (연산자, 괄호, 식별자 등) 단위로 자른 후,
이 문법요소들을 해석하여 추상 구문 트리를 생성한다. 이 과정에서 문법에 맞지 않는 소스 코드는
사용자에게 알려준다.
2) 최적화 : 추상 구문 트리를 분석하여 최적화를 수행한다. 도달할 수 없는 코드를 식별하거나, 상수 표현식을 미리
계산해 두거나, 루프 풀기 등의 대부분의 최적화가 이 단계에서 수행된다.
3) 코드 생성 : 최적화된 구문 트리로부터 목적 코드를 생성한다. 목표 언어가 기계어일 경우,
레지스터 할당, 연산 순서 바꾸기 등 하드웨어에 맞는 최적화가 이 단계에서 수행된다.
대부분의 하드웨어 최적화 알고리즘은 NP 복잡도를 갖지만, 휴리스틱을 통해 많은 최적화가 수행된다.
4) 링킹 : 목적 코드가 기계어일 경우, 여러 라이브러리 목적 코드를 묶어 하나의 실행 파일을 생성하게 된다.
이 과정은 링커에 의해 수행되며, 어떤 사람들은 링커를 컴파일러의 일부로 간주하지 않기도 한다.
컴파일러는 입출력되는 언어의 종류, 내부 구조, 목적 코드의 동작에 따라 여러 가지로 분류할 수 있다.
컴파일러가 실행되는 컴퓨터나 운영 체제가 컴파일러의 목적코드가 실행될 컴퓨터나 운영체제와 같은 경우
네이티브 컴파일러 또는 hosted compiler라고 한다.
'Dokhak > 컴퓨터' 카테고리의 다른 글
[Computer] 공용 언어 런타임 (CLR) 이란? (0) | 2022.08.05 |
---|---|
[Computer] 닷넷 프레임워크란? (0) | 2022.08.05 |
[Computer] 운영 체제란? (0) | 2022.08.03 |
[Computer] 런타임이란? (0) | 2022.08.03 |
[Computer] Process와 Thread란? ft.멀티쓰레드 (0) | 2022.08.02 |