編譯器

將源代碼轉換為目標代碼的計算機程序

編譯器compiler)是一種電腦程式,它會將某種程式語言寫成的原始碼(原始語言)轉換成另一種程式語言(目標語言)。

它主要的目的是將便於人編寫、閱讀、維護的進階電腦語言所寫作的原始碼程式,翻譯為電腦能解讀、執行的低階機器語言的程式,也就是執行檔。編譯器將原始程式(source program)作為輸入,翻譯產生使用目標語言(target language)的等價程式。原始碼一般為高階語言(High-level language),如Pascal、C、C++、C# 、Java等,而目標語言則是匯編語言或目標機器的目標碼(Object code),有時也稱作機械碼(Machine code)。

一個現代編譯器的主要工作流程如下:

原始碼(source code)→ 預處理器(preprocessor)→ 編譯器(compiler)→ 組譯程式(assembler)→ 目標碼(object code)→ 連結器(linker)→ 執行檔(executables),最後打包好的檔案就可以給電腦去判讀執行了。

歷史

早期的電腦軟件都是用匯編語言直接編寫的,這種狀況持續了數年。當人們發現為不同類型的中央處理器(CPU)編寫可重用軟件的開銷要明顯高於編寫編譯器時,人們發明了高階程式語言。由於早期的電腦的主記憶體很少,當大家實現編譯器時,遇到了許多技術難題。

大約在20世紀50年代末期,與機器無關的程式語言被首次提出。隨後,人們開發了幾種實驗性質的編譯器。第一個編譯器是由美國女性電腦科學家葛麗絲·霍普(Grace Murray Hopper)於1952年為A-0 系統編寫的。但是1957年由任職於IBM的美國電腦科學家約翰·巴科斯(John Warner Backus)領導的FORTRAN則是第一個被實作出具備完整功能的編譯器。1960年,COBOL成為一種較早的能在多種架構下被編譯的語言。

高階語言在許多領域流行起來。由於新的程式語言支援的功能越來越多,電腦的架構越來越複雜,這使得編譯器也越來越複雜。

早期的編譯器是用匯編語言編寫的。首個能編譯自己源程式的編譯器是在1962年由麻省理工學院的Hart和Levin製作的。從20世紀70年代起,實現能編譯自己源程式的編譯器變得越來越可行,不過還是用PascalC語言來實現編譯器更加流行。製作某種語言的第一個能編譯器,要麼需要用其它語言來編寫,要麼就像Hart和Levin製作Lisp編譯器那樣,用直譯器來執行編譯器。

教學用的編譯器

編譯器的構造與最佳化是電腦專業的大學課程,[1]課程名稱一般為「編譯原理」或「編譯器」。通常在課程中包含了如何實現一種教學用程式語言的編譯器。一個著名的例子是20世紀70年代,瑞士電腦科學家尼克勞斯·維爾特Niklaus Emil Wirth)用於講解編譯器的構造時使用的PL/0英語PL/0編譯器。儘管它很簡單,PL/0編譯器介紹了這個領域的幾個有影響的概念:

  1. 逐步求精的程式開發(也是 1971年 Wirth 的論文的標題)[2]
  2. 使用遞歸下降解析器
  3. 使用EBNF指定語言的語法。
  4. 碼產生器產生可攜式P-code
  5. 在自舉問題的正式描述中使用T-diagram。

分類

編譯器的一種分類方式是按照生成代碼所執行的系統平台劃分,這個平台稱為目標平台。

有一些編譯器輸出的代碼,將執行於與編譯器所在相同類型的電腦和作業系統之上,這種編譯器叫做本地編譯器。輸出可以執行於不同的平台之上的編譯器,叫做交叉編譯器。由於嵌入式系統通常沒有軟件開發環境,因此,為這類系統開發軟件時,通常需要使用交叉編譯器。

編譯器所輸出於虛擬機器上執行之代碼,編譯器和編譯器輸出的執行平台有可能相同,也有可能不同。因此,對於這類編譯器,不去區分它是本地編譯器還是交叉編譯器。

參考文獻

  1. ^ Chakraborty, P., Saxena, P. C., Katti, C. P., Pahwa, G., Taneja, S. A new practicum in compiler construction. Computer Applications in Engineering Education, In Press. http://onlinelibrary.wiley.com/doi/10.1002/cae.20566/pdf頁面存檔備份,存於互聯網檔案館
  2. ^ The ACM Digital Library. (原始內容存檔於2007-07-17). 

延伸閱讀

參見

外部連結