標記式語言

现代系统文档注释

標記式語言(英語:markup language),也稱置標語言標記式語言標誌語言標識語言標示語言,是一種將文字Text)以及文字相關的其他資訊結合起來,展現出關於該網頁結構和資料的電腦文字編碼。與文字相關的其他資訊(包括例如文字的結構和連結等)與原來的文字結合在一起,但是使用標記(markup)進行標識。當今廣泛使用的標記式語言是超文件標示語言HyperText Markup LanguageHTML)和可延伸標示語言eXtensible Markup LanguageXML)。標記式語言廣泛應用於網頁網路應用程式。標記最早用於出版業,是作者、編輯以及出版商之間用於描述出版作品的排版格式所使用的。

標識語言的分類

標識語言通常可以分為三類:表示性的、過程性的以及描述性的。

表示性的標識語言

表示性的標識語言(Presentational markup)是在編碼過程中,標記文件的結構資訊。例如,在文字檔案中,檔案的標題可能需要用特定的格式表示(居中,放大等),這樣我們就需要標記檔案的標題。字處理以及桌面出版產品有時候能夠自動推斷出這類的結構資訊,但是絕大多數的,像Wiki這樣的純文字編輯器還不能解決這個問題。

過程性標識

過程性標識語言(Procedural markup)一般都專門於文字的表達,但通常對於文字編輯者可見,並且能夠被軟體依其出現順序依次解讀。為了格式化一個標題,在標題文字之前,會緊接著插入一系列的格式標識符,以指示電腦轉換到居中的顯示模式,同時加大及加粗字型。在標題文字之後,會緊接綴上格式中止標識;對於更進階的系統宏命令或者堆疊模式會讓這一過程的實現方式更加豐富。大多數情況下,過程性標識能力包含有一個Turing-complete程式語言。過程性標識語言的範例有:nroff, troff, TeX, Lout以及PostScript。過程性標識語言被廣泛應用在專業出版領域,專業的出版商會根據要求使用不同的指標語言以達到出版要求。

描述性標識

描述性標識(Descriptive Markup)也稱通用標識,所描述的是檔案的內容或結構,而不是檔案的顯示外觀或樣式,制定SGML的基本思想就是把文件的內容與樣式分開,XML、SGML都是典型的通用標識語言。

歷史

「標識(markup)」這個詞來源自傳統出版業的「標記」一個手稿,也就是在原稿的邊緣加注一些符號來指示列印上的要求。長久以來,這個工作都是由專門的人("markup men")以及校對人來進行,對原稿標識出使用什麼樣的字型,字型以及字號,然後再將原稿交給其它人進行手工的排版工作。

GenCode

TeX

TeX是一個由美國電腦教授高德納(Donald E. Knuth)編寫的功能強大的排版軟體。它在學術界十分流行,特別是數學物理學電腦科學界。TeX被普遍認為是一個很好的排版工具,特別是在處理複雜的數學公式時。利用諸如是LaTeX等終端軟體,TeX就能夠排版出精美的文字。

SGML

SGML是一種專門的標記式語言,被用作編寫《牛津英語詞典》的電子版本。由於SGML的複雜,導致難以普及。

HTML

超檔案標識語言(英文:HyperText Markup Language,簡稱為HTML)是為網頁建立和其它可在網頁瀏覽器中看到的資訊設計的一種標識語言。

XML

可延伸標識語言(eXtensible Markup Language,簡稱XML),又稱可延伸標記式語言,是一種標識語言。標識指電腦所能理解的資訊符號,通過此種標記,電腦之間可以處理包含各種資訊的文章等。

XHTML

可延伸超文字標識語言(eXtensible HyperText Markup Language,XHTML),是一種標識語言,表現方式與超文字標識語言(HTML)類似,不過語法上更加嚴格。

其它基於XML的應用

還有其它一些基於XML的應用,比如RDFXFormsDocBookSOAP以及Web Ontology Language(OWL)。具體可以參見XML標記式語言列表.

特徵

其他應用

  • XAML(Extensible Application Markup Language),基於XML語言,在微軟WPF(Windows Presentation Foundation)中使用。
  • HyTime

參考文獻

外部連結

參見