編譯器

編譯器（compiler）是一種電腦程式，它會將某種程式語言寫成的原始碼（原始語言）轉換成另一種程式語言（目標語言）。

它主要的目的是將便於人編寫、閱讀、維護的進階電腦語言所寫作的原始碼程式，翻譯為電腦能解讀、執行的低階機器語言的程式，也就是執行檔。編譯器將原始程式（source program）作為輸入，翻譯產生使用目標語言（target language）的等價程式。原始碼一般為高階語言（High-level language），如Pascal、C、C++、C# 、Java等，而目標語言則是匯編語言或目標機器的目標碼（Object code），有時也稱作機械碼（Machine code）。

一個現代編譯器的主要工作流程如下：

原始碼（source code）→ 預處理器（preprocessor）→ 編譯器（compiler）→ 組譯程式（assembler）→ 目標碼（object code）→ 連結器（linker）→ 執行檔（executables），最後打包好的檔案就可以給電腦去判讀執行了。

歷史

早期的電腦軟件都是用匯編語言直接編寫的，這種狀況持續了數年。當人們發現為不同類型的中央處理器（CPU）編寫可重用軟件的開銷要明顯高於編寫編譯器時，人們發明了高階程式語言。由於早期的電腦的主記憶體很少，當大家實現編譯器時，遇到了許多技術難題。

大約在20世紀50年代末期，與機器無關的程式語言被首次提出。隨後，人們開發了幾種實驗性質的編譯器。第一個編譯器是由美國女性電腦科學家葛麗絲·霍普（Grace Murray Hopper）於1952年為A-0 系統編寫的。但是1957年由任職於IBM的美國電腦科學家約翰·巴科斯（John Warner Backus）領導的FORTRAN則是第一個被實作出具備完整功能的編譯器。1960年，COBOL成為一種較早的能在多種架構下被編譯的語言。

高階語言在許多領域流行起來。由於新的程式語言支援的功能越來越多，電腦的架構越來越複雜，這使得編譯器也越來越複雜。

早期的編譯器是用匯編語言編寫的。首個能編譯自己源程式的編譯器是在1962年由麻省理工學院的Hart和Levin製作的。從20世紀70年代起，實現能編譯自己源程式的編譯器變得越來越可行，不過還是用Pascal和C語言來實現編譯器更加流行。製作某種語言的第一個能編譯器，要麼需要用其它語言來編寫，要麼就像Hart和Levin製作Lisp編譯器那樣，用直譯器來執行編譯器。

教學用的編譯器

編譯器的構造與最佳化是電腦專業的大學課程，^[1]課程名稱一般為「編譯原理」或「編譯器」。通常在課程中包含了如何實現一種教學用程式語言的編譯器。一個著名的例子是20世紀70年代，瑞士電腦科學家尼克勞斯·維爾特（Niklaus Emil Wirth）用於講解編譯器的構造時使用的PL/0（英語：PL/0）編譯器。儘管它很簡單，PL/0編譯器介紹了這個領域的幾個有影響的概念：

逐步求精的程式開發（也是 1971年 Wirth 的論文的標題）^[2]
使用遞歸下降解析器
使用EBNF指定語言的語法。
碼產生器產生可攜式P-code
在自舉問題的正式描述中使用T-diagram。

分類

編譯器的一種分類方式是按照生成代碼所執行的系統平台劃分，這個平台稱為目標平台。

有一些編譯器輸出的代碼，將執行於與編譯器所在相同類型的電腦和作業系統之上，這種編譯器叫做本地編譯器。輸出可以執行於不同的平台之上的編譯器，叫做交叉編譯器。由於嵌入式系統通常沒有軟件開發環境，因此，為這類系統開發軟件時，通常需要使用交叉編譯器。

編譯器所輸出於虛擬機器上執行之代碼，編譯器和編譯器輸出的執行平台有可能相同，也有可能不同。因此，對於這類編譯器，不去區分它是本地編譯器還是交叉編譯器。

參考文獻

^ Chakraborty, P., Saxena, P. C., Katti, C. P., Pahwa, G., Taneja, S. A new practicum in compiler construction. Computer Applications in Engineering Education, In Press. http://onlinelibrary.wiley.com/doi/10.1002/cae.20566/pdf （頁面存檔備份，存於互聯網檔案館）
^ The ACM Digital Library. （原始內容存檔於2007-07-17）.