Help:地图地名误译与异译/法语
在部分地图类应用程序(App)/网页中(Google地图占多数),许多法语地名的译名存在误译或是异译,造成此情况的原因有多种,对此各条目名称现也正在进行/已作出修正。
2012年左右,用户Tianyamm2与其机器人TianyammBOT使用自动维基浏览器(以下简称“机器人”)机翻创建了大量法国市镇条目,其在创建这些条目时大体依照法汉译音表,而法语地名翻译中习惯意译的部分也设定了规则进行意译。不过可能是由于该用户不谙法语,或是规则设定上出现了疏漏,这些由机翻创建的法国市镇条目名称绝大部分是错误的。
这一问题早在当时便有人发现并提出了讨论,但长久以来一直未能有人去系统性修正,以至于这些误译不断向站外输出,例如法国市镇Saint-Quentin-Fallavier与2012年10月16日被TianyammBOT以“圣屈昂坦法拉维耶”的机翻误译名称建立。2015年6月26日,当地发生恐袭事件,许多中国官媒及各级媒体使用了“圣屈昂坦法拉维耶”这一机翻误译[1][2][3][4][5]。
而在2019年中之前,Google地图会抓取中文维基百科的条目名,用于地图上,这造成了Google地图上有大量来自中文维基百科的机翻和人翻的误译。此外,Google地图也会从Wikidata中抓取中文名,用于地图上,这一“迷惑”做法甚至会产生极为夸张、恶劣的显示名称,例如法国市镇Bourron-Marlotte,其本应译作“布龙-马尔洛特”,其长久以来未在中文维基百科建立条目(即“消红”)。2016年5月10日,机器人Cewbot因不明原因向该市镇的Wikidata项目中添加了“危機處置”的中文名,之后Google地图便抓取了这一名称并不加甄别地用在了中文Google地图上,Bourron-Marlotte在Google地图上的中文名便成了“危機處置”。这两个问题与Google方面沟通无方,而对具体的某个误译地名提交反馈也会石沉大海,故Google地图的误译问题留存至今。
机翻错误大概有以下几类:
- 由于法语词尾的辅音多数是不发音的,因此该机器人设定机翻规则时将除“c”外的所有词尾辅音都设定成了删去不译(但“c”偶尔也出现了未译的情况;此外,由于机器人将“am/em/im/om/um”、“an/en/in/on/un”设为了字母组合的缘故,末尾多数的“m”、“n”同样未被删去,因此一些地名未被误译),然而除了“c”以外、“f”、“l”、“q”、“r”、“v”在法语词尾也是发音的,因此产生了大量误译。此外,在奧克西塔尼亞地区等地的地名末尾的“s”以及词尾“-ès”中的“s”通常是发音的,此机器人机翻规则亦未考虑到这一点。
- 法语词尾的“e”通常不发音,但翻译时应该考虑各种字母组合对应的情况,而该机器人在设定机翻规则时简单粗暴地设定成了把词尾的“e”删去然后直接翻译(不过由于机器人将“ie”、“ue”设为了字母组合的缘故,词尾为“ie”、“ue”时“e”并不会被删去,但这同样造成了误译),以至于出现了大量误译,例如“-ane”应按“-阿讷”译,结果该机器人由于粗暴删去“e”再直接翻译的译法,将其误当成了“-an”,从而误译成了“昂”。此外,法语词尾的“es”与“e”相同,同样不发音,但该机器人设置规则时并未考虑到这一点,以至于将其均按上一条的方法删去“s”再译,结果全部译错。
- “e”在法语中的发音有/ə/、/e/、/ɛ/(发/e/、/ɛ/时译法相同)及不发音四种情况,机器人对此判断不佳,以至于误译了大多数的“e”。
- 机器人在机翻多数地名时使用了法汉人名译音表而非地名译音表,以至于部分译字并未按地名译音表的译字来译,如“au”、“ne”(发音为/n/或/nə/时)、“gi”误按人名译音表译成了“奥”、“纳”、“吉”而不是按地名译音表应译的“欧”、“讷”、“日”。
- “s”在“l”、“m”、“n”前通常不发音,此机器人机翻规则未考虑到这一点,造成了一些误译,如“Presnoy”被误译作“普雷斯努瓦”(应译作“普雷努瓦”)。
- 联诵(Saint除外)没有译出,例如“Villette-lès-Arbois”中“lès”最后的字母“s”与“Arbois”联诵,应译作“维莱特莱萨尔布瓦”却被误译作“维莱特莱阿尔布瓦”。
- “ia”应连译作“亚”,“ian”应连译作“扬”,“ion”应连译作“永”……,诸如此类,然而此机器人机翻规则未考虑到这一点,将其拆译作“伊”+“阿”、“伊”+“昂”、“伊”+“翁”……,造成了一些误译。
- 为防止望文生义,本该按“东”、“南”、“西”译写的音节出现在地名开头时,用“栋”、“楠”、“锡”译写,机器人未遵循这一点,仍译作了“东”、“南”、“西”,如“Civaux”被误译作“西沃”(应译作“锡沃”),“Nantheuil”被误译作“南特伊”(应译作“楠特伊”)。
- 阿尔萨斯与洛林地区的地名大多来源于德语、阿尔萨斯语、洛林法兰克语等语言,不符合法语正字法,故翻译时应按照实际发音译写,然而机器人误将其全部按法汉译音表翻译,结果基本全部译错。此外,东比利牛斯省的许多地名来源于加泰罗尼亚语,大西洋比利牛斯省的部分地名来源于巴斯克语,布列塔尼地区的部分地名来源于布列塔尼语,亦不符合(或不完全符合)法语正字法,因此同样造成了一些误译。
- 若一个法语地名是由两个或多个语素构成,那么应该考虑各语素的发音。如地名Montmédy,其应拆分为Mont/médy,其中“Mont”(法语地名常见成分,意为“山”)的发音为/mɔ̃/,“médy”的发音为/medi/,故Montmédy的发音为/mɔ̃medi/,应译作“蒙梅迪”,然而该机器人并未设定相关规则,机翻时将其误译作了“蒙特梅迪”,“Pont-”、“Champ-”等通名的误译亦属此种情形。此类情况在诸类误译中也占了很大比重。
- 法语地名中介词“sur”常接河名,“en”常接地区(通常为région naturelle)名,而法语地名翻译中这两种情况也习惯意译作“XXX河畔XXX”与“XXX地区XXX”,因此该机器人设定机翻规则时将所有的“sur”、“en”均设定为译作“河畔”、“地区”。然而,亦有部分“sur”接的是地名而非河名,表示“在……上方”;而“en”所接的也并非全部都是地区名,例如“en-Val”(意为“在谷地”)、“en-Montagne”(意为“在山区”)、“en-Forêt”(意为“在林中”)等就不是,因此机器人将“sur”、“en”全部译作“河畔”、“地区”也造成了大量误译。
- 介词“sur”后接河名时,如果河名带定冠词,定冠词会被误译进去,例如“Noncourt-sur-le-Rongeant”被误译作“莱-龙让河畔农库尔”(应译作“龙让河畔农库尔”)。
- 双“r”与单“r”发音相同,译法相同,机器人误将双“r”重复翻译,例如“Larrivoire”被误译作“拉尔里瓦尔”(应译作“拉里瓦尔”)。
- 一般情况下“aill”、“eill”、“auill”、“ouill”、“uill”、“oill”、“ill”后接元音时的发音分别为/aj/、/ɛj/、/oj/、/uj/、/ɥij/、/waj/、/waj/、/ij/,应按分别按“阿”、“埃”、“欧”、“乌”、“于”、“瓦”、“伊”行再加“伊”列译写,机器人未设置规则,将其拆分成“ai/ll”、“ei/ll”、“aui/ll”、“oui/ll”、“ui/ll”、“oi/ll”、“i/ll”译写,结果全部译错,例如“Maillé”被误译作“迈莱”(应译作“马耶”)。
- 来自奥克语的地名中字母“ilh”等同于法语中的“ill”,机器人也将其设置为了按“伊”列译写(不过“ill”反倒没有设置译写规则,如上条所述),也确实译对了相当多的条目(如“Peyrilhac”被正确译成了“佩里亚克”),但是非奥克语地区的“lh”发音不为/j/而只是普通的/l/,机器人全部译错,例如“Kalhausen”被误译作“卡约桑”(应译作“卡劳森”,“劳森”因语源关系依照实际发音而非与译音表逐字对应)。而且发音为“伊”的多为“ilh”,许多“lh”即便是在奥克语地区其发音也是/l/,如“Saint-Jean-Lherm”发音为[sɛ̃ ʒɑ̃ lɛʁm],应译“圣让莱尔姆”,机器人却误译为了“圣让耶尔姆”。此外,“L'h”亦会被识别成“Lh”而被误译,例如“L'Hôtellerie”被误译作“约泰勒里耶”(应译作“洛泰勒里”)。
- 多数“-st”、“-lt”、“-lx”、“-pt”词尾不发音,机器人全部译错;而个别地名中这些词尾发音,不过是两个字母都发,由于机器人删去最后一个字母再译写的规则,同样全部译错。
- 法语中字母“h”不发音,不过有分音的功能,机器人在译写地名时将字母“h”全部粗暴删去,导则部分地名被译错,例如“Cahuzac”被粗暴删去“h”误视作“Cauzac”而被误译作“科扎克”(应译作“卡于扎克”)。
- 按照发音,“元n元”(即元音加字母“n”加元音)应断作“元/n元”译写,但部分地名中机器人在译写时误断作“元n/元”从而造成误译,例如“Menotey”被误断作“Men/o/tey”而被误译作“芒奥泰”(应断作“Me/no/tey”,译作“默诺泰”)。
- “qu”加元音字母发音为/k/(少数语源特殊的地名除外,如Quatzenheim),按“克”列译,机器人在译写未设置相应规则,全部拆解为“屈”加元音翻译,造成了大量误译,例如“Lanquais”被误译作“朗屈艾”(应译作“朗凯”)。
- 部分专名或通名有传统译名,不遵循译音表,如“Meuse”译作“默兹河”而非“默斯河”,机器人在误译带“-sur-Meuse”的地名时全部误译为了“默斯河畔……”。
- 莫名其妙的译字错误,例如“Balagny-sur-Thérain”,字母“l”前无“r”,本应译作“泰兰河畔巴拉尼”却无中生“尔”误译作“泰兰河畔巴尔拉尼”;“Bazincourt-sur-Epte”,字母“z”前无“r”或“l”,本应译作“埃普特河畔巴赞库尔”却无中生“尔”误译作“埃普特河畔巴尔赞库尔”;“Argiésans”,明明是字母“g”却误译作了“阿尔比耶桑”;“Loiré-sur-Nie”,河名仅为“Nie”,却无中生“德”误译作“尼德河畔卢瓦雷”。
- 应译写作“桑特”的成分会被误转换为“圣”,如“Cintré”被误译作“圣雷”(应译作“桑特雷”),“Présentevillers”被误译作“普雷圣维莱尔”(应译作“普雷桑特维莱”)。
- 字母“œ”被误拆作“oe”从而造成误译,如“Crèvecœur-le-Petit”被误译作“小克雷韦科厄”(应译作“小克雷沃克尔”)。
参考文献
- ^ 连环恐怖袭击凸显国际反恐形势严峻-新华网. www.xinhuanet.com. [2024-12-23].
- ^ 法国突尼斯科威特一天三起恐袭60死多伤--国际--人民网. world.people.com.cn. [2024-12-23].
- ^ 连环恐怖袭击凸显国际反恐形势严峻--军事--人民网. military.people.com.cn. [2024-12-23].
- ^ 百余法国穆斯林清真寺前集会 抗议恐怖主义. 环球网. [2024-12-23] (中文(中国大陆)).
- ^ 法国“斩首”事件:死者人头被钉工厂大门,嫌疑人有极端倾向.