博多式電報機

博多式電報機是法國人埃米爾‧博多英語Émile Baudot於1874年發明的「印字電報機英語Printing telegraph」。主要特點是字符用5位元編碼,採用兩個字符集。

1884年的5鍵式
穿孔紙帶的每行表示一個5位元編碼的字符

博多碼

博多於1872年[1][2]開發了他的第一台多路復用電報機,並在1874年申請專利[1][3]。1876年,他按照卡爾·弗里德里希·高斯威廉·愛德華·韋伯的建議將6位編碼修改為5位編碼[1][2]

博多發明的電報裝置,發報方通過一個類似於鋼琴鍵盤樣的裝置輸入報文。該裝置上面有5個鍵,發報者的左手控制2個鍵,右手控制另外3個鍵。5個鍵在某個時刻的各自的按下/復原狀態,可以表示2的5次方即32個狀態之一,因此該裝置可以直接輸入32個字符。能容下拉丁字母表的26個字母。但是,為了解決10個數字與十幾個標點符號的輸入問題,博多的解決辦法是使用兩套各自含31個元素的字符集,第一個字符集主要表示字母表,以及一個切換到第二個字符集的符號;第二個字符集表示10個阿拉伯數字及標點符號,以及一個切換到第一個字符集的符號;不共用切換符號。除了切換符號,又共用了兩個空白符號和兩個換行符號。這樣兩個字符集總共能表示58多個博多碼。收報方的機器自動解碼,直接在紙帶上印出可供人直接閱讀的報文內容。

博多碼也被稱作國際電報字母第1號(英語:International Telegraph Alphabet No. 1,ITA1),目前已不再使用。


電傳打字機

1899年,美國人Donald Murray英語Donald Murray發明了類似於標準打字機的電報輸入設備。這就是「電傳打字機」(teletype/teleprinter)。這使得只要是會用傳統打字機的普通人,就可以用接入電報網路的電傳打字機直接交流。Murray發明的電傳打字機的輸出是穿孔紙帶。穿孔紙帶可以由電報機自動發報。字符在穿孔紙帶上的編碼還是採取了博多提出的5位元、雙字符集的辦法。但根據字符出現頻率而改進了編碼方案,使得高頻率字符只需要儘可能少的紙帶打孔,而低頻率字符就需要在紙帶上打孔較多。例如,字母T僅需要打1個孔來表示;而字母Q需要打4個孔來表示。

ITA2碼

Murray的這套編碼於1930年代被CCITT標準化為國際電報字母表第2號(the International Telegraph Alphabet No. 2,ITA2),一直使用到1963年被7位元的ASCII碼取代。

國際電報字母表第2號
International telegraphy alphabet No. 2(Baudot-Murray code)[4]
Pattern of impulses
1=mark 0=space
字母集 數字標點符號集
大端序 小端序
00000 00000 Null Null
00100 00100 Space Space
10111 11101 Q 1
10011 11001 W 2
00001 10000 E 3
01010 01010 R 4
10000 00001 T 5
10101 10101 Y 6
00111 11100 U 7
00110 01100 I 8
11000 00011 O 9
10110 01101 P 0
00011 11000 A
00101 10100 S Bell
01001 10010 D $
01101 10110 F !
11010 01011 G &
10100 00101 H #
01011 11010 J '
01111 11110 K
10010 01001 L
10001 10001 Z "
11101 10111 X /
01110 01110 C :
11110 01111 V ;
11001 10011 B ?
01100 00110 N ,
11100 00111 M .
01000 00010 Carriage return Carriage return
00010 01000 Line feed Line feed
11011 11011 Shift to figures
11111 11111 Shift to letters

ITA2是5位元編碼,包括字母集("letter shift",LTRS)與數字標點符號集兩個字符集("figure shift",FIGS)。在FIGS字符(碼位為1B)後的字符都在數字標點符號集中解讀,直到遇到LTRS字符(碼位為1F)。LTRS字符後的字符都在字母集中解讀,直到遇到FIGS字符為止。


 
ITA2碼表。這種圖中,從00到1F共計32個數字,每個數字可以編碼一個字母(LETTERS),或者一個數字/標點符號(FIGURES)。有6個控制字符是兩個字符集共有的:00 NUL空字符;02 LF換行;04 SP空格;1B FIGS切換入數字字符集;1F LTRS切換入字母字符集。

俄語博多碼

 
1900年代的俄國博多式電報機鍵盤

由於西里爾字母表比較大,所以俄語的博多碼(MTK-2俄語МТК-2)使用3個5位元編碼的字符集,分別表示:

  • 拉丁字母表
  • 西里爾字母表的大部分
  • 少量西里爾字母與阿拉伯數字

參考文獻

  1. ^ 1.0 1.1 1.2 Fischer, Eric N. The Evolution of Character Codes, 1874–1968. 2000-06-20 [2020-12-20]. ark:/13960/t07x23w8s. [...] In 1872, [Baudot] started research toward a telegraph system that would allow multiple operators to transmit simultaneously over a single wire and, as the transmissions were received, would print them in ordinary alphabetic characters on a strip of paper. He received a patent for such a system on June 17, 1874. [...] Instead of a variable delay followed by a single-unit pulse, Baudot's system used a uniform six time units to transmit each character. [...] his early telegraph probably used the six-unit code [...] that he attributes to Davy英語Edward Davy in an 1877 article. [...] in 1876 Baudot redesigned his equipment to use a five-unit code. Punctuation and digits were still sometimes needed, though, so he adopted from Hughes英語David Edward Hughes the use of two special letter space and figure space characters that would cause the printer to shift between cases at the same time as it advanced the paper without printing. The five-unit code he began using at this time [...] was structured to suit his keyboard [...], which controlled two units of each character with switches operated by the left hand and the other three units with the right hand. [...]  [1][2]
  2. ^ 2.0 2.1 H. A. Emmons. Printer Systems. Wire & Radio Communications. 1 May 1916, 34: 209 [2022-02-16]. (原始內容存檔於2022-02-16). 
  3. ^ Baudot, Jean-Maurice-Émile. Système de télégraphie rapide. Archives Institut National de la Propriété Industrielle英語Institut National de la Propriété Industrielle (INPI). June 1874. Patent Brevet 103,898. (原始內容存檔於2017-12-16) (法語). 
  4. ^ dataIP Limited. The "Baudot" Code. [9 October 2010]. (原始內容存檔於2010年8月26日)