博多式电报机

博多式电报机是法国人埃米尔‧博多英语Émile Baudot于1874年发明的“印字电报机英语Printing telegraph”。主要特点是字符用5比特编码,采用两个字符集。

1884年的5键式
穿孔纸带的每行表示一个5比特编码的字符

博多码

博多于1872年[1][2]开发了他的第一台多路复用电报机,并在1874年申请专利[1][3]。1876年,他按照卡爾·弗里德里希·高斯威廉·爱德华·韦伯的建议将6位编码修改为5位编码[1][2]

博多发明的电报装置,发报方通过一个类似于钢琴键盘样的装置输入报文。该装置上面有5个键,发报者的左手控制2个键,右手控制另外3个键。5个键在某个时刻的各自的按下/复原状态,可以表示2的5次方即32个状态之一,因此该装置可以直接输入32个字符。能容下拉丁字母表的26个字母。但是,为了解决10个数字与十几个标点符号的输入问题,博多的解决办法是使用两套各自含31个元素的字符集,第一个字符集主要表示字母表,以及一个切换到第二个字符集的符号;第二个字符集表示10个阿拉伯数字及标点符号,以及一个切换到第一个字符集的符号;不共用切換符號。除了切換符號,又共用了兩個空白符號和兩個換行符號。这样两个字符集总共能表示58多个博多码。收报方的机器自动译码,直接在纸带上印出可供人直接阅读的报文内容。

博多码也被称作国际电报字母第1号(英語:International Telegraph Alphabet No. 1,ITA1),目前已不再使用。


电传打字机

1899年,美国人Donald Murray英语Donald Murray发明了类似于标准打字机的电报输入设备。这就是“电传打字机”(teletype/teleprinter)。这使得只要是会用传统打字机的普通人,就可以用接入电报网路的电传打字机直接交流。Murray发明的电传打字机的输出是穿孔纸带。穿孔纸带可以由电报机自动发报。字符在穿孔纸带上的编码还是采取了博多提出的5比特、双字符集的办法。但根据字符出现频率而改进了编码方案,使得高频率字符只需要尽可能少的纸带打孔,而低频率字符就需要在纸带上打孔较多。例如,字母T仅需要打1个孔来表示;而字母Q需要打4个孔来表示。

ITA2码

Murray的这套编码于1930年代被CCITT标准化为國際電報字母表第2號(the International Telegraph Alphabet No. 2,ITA2),一直使用到1963年被7比特的ASCII码取代。

國際電報字母表第2號
International telegraphy alphabet No. 2(Baudot-Murray code)[4]
Pattern of impulses
1=mark 0=space
字母集 数字标点符号集
大端序 小端序
00000 00000 Null Null
00100 00100 Space Space
10111 11101 Q 1
10011 11001 W 2
00001 10000 E 3
01010 01010 R 4
10000 00001 T 5
10101 10101 Y 6
00111 11100 U 7
00110 01100 I 8
11000 00011 O 9
10110 01101 P 0
00011 11000 A
00101 10100 S Bell
01001 10010 D $
01101 10110 F !
11010 01011 G &
10100 00101 H #
01011 11010 J '
01111 11110 K
10010 01001 L
10001 10001 Z "
11101 10111 X /
01110 01110 C :
11110 01111 V ;
11001 10011 B ?
01100 00110 N ,
11100 00111 M .
01000 00010 Carriage return Carriage return
00010 01000 Line feed Line feed
11011 11011 Shift to figures
11111 11111 Shift to letters

ITA2是5比特编码,包括字母集("letter shift",LTRS)与数字标点符号集两个字符集("figure shift",FIGS)。在FIGS字符(码位为1B)后的字符都在数字标点符号集中解读,直到遇到LTRS字符(码位为1F)。LTRS字符后的字符都在字母集中解读,直到遇到FIGS字符为止。


 
ITA2码表。这种图中,从00到1F共计32个数字,每个数字可以编码一个字母(LETTERS),或者一个数字/标点符号(FIGURES)。有6个控制字符是两个字符集共有的:00 NUL空字符;02 LF换行;04 SP空格;1B FIGS切换入数字字符集;1F LTRS切换入字母字符集。

俄语博多码

 
1900年代的俄国博多式电报机键盘

由于西里尔字母表比较大,所以俄语的博多码(MTK-2俄语МТК-2)使用3个5比特编码的字符集,分别表示:

  • 拉丁字母表
  • 西里尔字母表的大部分
  • 少量西里尔字母与阿拉伯数字

参考文献

  1. ^ 1.0 1.1 1.2 Fischer, Eric N. The Evolution of Character Codes, 1874–1968. 2000-06-20 [2020-12-20]. ark:/13960/t07x23w8s. [...] In 1872, [Baudot] started research toward a telegraph system that would allow multiple operators to transmit simultaneously over a single wire and, as the transmissions were received, would print them in ordinary alphabetic characters on a strip of paper. He received a patent for such a system on June 17, 1874. [...] Instead of a variable delay followed by a single-unit pulse, Baudot's system used a uniform six time units to transmit each character. [...] his early telegraph probably used the six-unit code [...] that he attributes to Davy英语Edward Davy in an 1877 article. [...] in 1876 Baudot redesigned his equipment to use a five-unit code. Punctuation and digits were still sometimes needed, though, so he adopted from Hughes英语David Edward Hughes the use of two special letter space and figure space characters that would cause the printer to shift between cases at the same time as it advanced the paper without printing. The five-unit code he began using at this time [...] was structured to suit his keyboard [...], which controlled two units of each character with switches operated by the left hand and the other three units with the right hand. [...]  [1][2]
  2. ^ 2.0 2.1 H. A. Emmons. Printer Systems. Wire & Radio Communications. 1 May 1916, 34: 209 [2022-02-16]. (原始内容存档于2022-02-16). 
  3. ^ Baudot, Jean-Maurice-Émile. Système de télégraphie rapide. Archives Institut National de la Propriété Industrielle英语Institut National de la Propriété Industrielle (INPI). June 1874. Patent Brevet 103,898. (原始内容存档于2017-12-16) (法语). 
  4. ^ dataIP Limited. The "Baudot" Code. [9 October 2010]. (原始内容存档于2010年8月26日)