Lingua Libre

維基媒體發音專案與工具

Lingua Libre是法国维基媒体协会建立的一个在线协作项目与工具,用以建立使用使用自由授权条款的协作多语言视听语料库

Lingua Libre
2020年网站主页概览
网站类型
  • 语言纪录工具
  • 在线语言媒体库
语言多语言
持有者法国维基媒体协会
创始人法国维基媒体协会与维基媒体社群
网址lingualibre.org
广告
商业性质
注册选择性,但若要录制则为必要
推出时间2016年8月,​8年前​(2016-08
现状活跃
内容许可
知识共享姓名标示-相同方式分享 4.0 国际 (CC BY-SA 4.0)

描述

Lingua Libre可以录制任何语言的单字短语句子,包含口语(录音)或手语(录影)。

单字以列表的形式呈现给要录制语音的人,该列表可能会是即时制作或是提前制作,又或是使用既有的维基媒体分类。录制语音的人只需要念出屏幕上显示的单字,当软件侦测到念完单字后的沉默时,就会跳到下一个单字。[1]这个行为是在其建立者,Nicolas Vion,的协助下从开放原始码软件Shtooka录制程序处借用,使得每小时录制数百个单字成为可能。然后录音会自动从网页客户端上传至维基共享资源媒体库。

2021年春季,Lingua Libre因史特拉斯堡发生火灾而离线,[2]但并未丢失任何录音。[3]

使用录音

可在Lingua Libre或维基共享资源上查阅录音。其主要用于其他维基媒体项目,例如用来说明维基词典中的条目或是维基百科文章中的专有名词。[1]

并可在语言教学环境中重复使用录音,语言学习者可以免费下载发音并在流行的词典软件GoldenDict上使用。[4]因此,此处的录音可在GoldenDict上作为“发音词典”使用,而不需要互联网连线。

这些录音也会在自然语言处理项目中重复使用,例如用来驱动Mozilla的DeepSpeech语音识别引擎。[5]

版本

Lingua Libre于2015年1月23日启动[6],经历过三个主要版本:

Lingua Libre v.1 (2016)

作为Languages of France项目的一部分,该项目目标是在维基媒体与互联网项目上记录并推广法国的区域语言,Lingua Libre的概念于2015年11月开始,部分资金来自DGLFLF(法语及法国语言总代表团,英语:General Delegation for the French language and the languages of France)。该项目的第一个版本于2016年8月推出。当时仅适用于录音,Lingua Libre在2016年12月的奥克语工作坊上展示,[7][8]然后呈现给在线维基媒体社群[9],也于2017年的国际活动上展示。

Lingua Libre v.2 (2018)

2017年底全面重建。新版Lingua Libre是以MediaWiki为基础,使用WikibaseOAuth以便更好地融入维基媒体环境。其接口透过Translatewiki.net翻译,因此该项目可被大量社群使用。新版的网站于2018年6月准备就绪[10],并于2018年8月向大众开放。

Lingua Libre v.2.2 (2020)

2020年,平台发生重大变化;有了专为该网站开发的新外观,而.org网域也取代了先前使用的.fr网域。[11]Lingua Libre现在支持透过视频录制手语

统计资料

 
2017年在蒙特利尔时与一位讲阿提卡米克语的人一起录音。

在项目启动的前两年,大约制作了一万份的录音。向v.2的过渡也同时伴随着贡献的快速增加。在不到一年的时间内,录音的数量增加超过十倍,于2019年5月时就超过十万份,这些录音是由127位贡献者以近50种语言录制的。[12]到了2020年9月,该平台已有90种语言的超过三十万份录音,贡献者超过350人。2021年6月达到了五十万份录音的里程碑这要归功于120种语言的540名贡献者。[13]

参见

参考资料

  1. ^ 1.0 1.1 Sabine Buchwald. Wie Wikipedia Bairisch lernt. Süddeutsche Zeitung. 2019-08-04 [2022-08-21]. (原始内容存档于2023-01-18) (德语). 
  2. ^ France : un incendie se déclare au datacenter OVHcloud de Strasbourg. Wikinews French. 2021-03-11 [2022-08-21]. (原始内容存档于2022-08-08) (法语). 
  3. ^ Lingua Libre 2.3 - Phoenix Edition ǃ. Meta-wiki. 2021-03-19 [2022-08-21]. (原始内容存档于2021-05-07). 
  4. ^ GoldenDict: Dictionary with Wikipedia integration - gHacks Tech News. 2017-07-10 [2022-08-21]. (原始内容存档于2022-06-26). 
  5. ^ Modèle français 0.4 pour DeepSpeech v0.6. Mozilla Discourse. 2020-03-10 [2022-08-21]. (原始内容存档于2022-08-21). 
  6. ^ Rémy Gerbet, Lingua Libre : un nouvel outil collaboratif pour le public et les chercheurs, Culture et Recherche, 2018-05-14, (137): 52 [2022-08-21], ISSN 1950-6295, (原始内容存档于2022-08-20) (法语) 
  7. ^ French Ministry of Culture. Oc-a-thon 2016 : deux journées contributives sur l'occitan les 9 et 10 décembre. 2016-11-16 [2022-08-21]. (原始内容存档于2020-08-03) (法语). 
  8. ^ Mathieu Denel. L'oc-a-thon, un edit-a-thon pour enrichir les projets Wikimedia et Lingua Libre en langue occitane. Wikimédia France Web Blog. 2016-12-21 [2020-12-03]. (原始内容存档于2023-01-16) (法语). 
  9. ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2017-08-01 [2020-12-02]. (原始内容存档于2022-07-05) (法语). 
  10. ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2018-07-01 [2020-12-02]. (原始内容存档于2022-08-21) (法语). 
  11. ^ Sara Krichen. Lingua Libre fait peau neuve !. Wikimédia France Web Blog. 2020-06-02 [2020-12-02]. (原始内容存档于2022-11-29) (法语). 
  12. ^ Miguel Trancozo Trevino. The many languages missing from the internet. BBC.com. 2020-04-15 [2022-08-21]. (原始内容存档于2023-01-18). 
  13. ^ Lingua Libre's statistics page

外部链接