Lingua Libre

維基媒體發音專案與工具

Lingua Libre是法國維基媒體協會建立的一個線上協作專案與工具,用以建立使用使用自由授權條款的協作多語言視聽語料庫

Lingua Libre
2020年網站首頁概覽
网站类型
  • 語言紀錄工具
  • 線上語言媒體庫
语言多語言
持有者法國維基媒體協會
创始人法國維基媒體協會與維基媒體社群
网址lingualibre.org
广告
商业性质
注册選擇性,但若要錄製則為必要
推出时间2016年8月,​8年前​(2016-08
现状活躍
內容許可
創用CC姓名標示-相同方式分享 4.0 國際 (CC BY-SA 4.0)

描述

Lingua Libre可以錄製任何語言的單字短语句子,包含口語(錄音)或手語(錄影)。

單字以列表的形式呈現給要錄製語音的人,該列表可能會是即時製作或是提前製作,又或是使用既有的維基媒體分類。錄製語音的人只需要念出螢幕上顯示的單字,當軟體偵測到唸完單字後的沉默時,就會跳到下一個單字。[1]這個行為是在其建立者,Nicolas Vion,的協助下從開放原始碼軟體Shtooka錄製程式處借用,使得每小時錄製數百個單字成為可能。然後錄音會自動從網頁客戶端上傳至维基共享资源媒體庫。

2021年春季,Lingua Libre因史特拉斯堡發生火災而離線,[2]但並未遺失任何錄音。[3]

使用錄音

可在Lingua Libre或维基共享资源上查閱錄音。其主要用於其他維基媒體專案,例如用來說明维基词典中的條目或是維基百科文章中的專有名詞。[1]

並可在語言教學環境中重複使用錄音,語言學習者可以免費下載發音並在流行的詞典軟體GoldenDict上使用。[4]因此,此處的錄音可在GoldenDict上作為「發音詞典」使用,而不需要網際網路連線。

這些錄音也會在自然语言处理專案中重複使用,例如用來驅動Mozilla的DeepSpeech语音识别引擎。[5]

版本

Lingua Libre於2015年1月23日啟動[6],經歷過三個主要版本:

Lingua Libre v.1 (2016)

作為Languages of France專案的一部分,該專案目標是在維基媒體與網際網路專案上記錄並推廣法國的區域語言,Lingua Libre的概念於2015年11月開始,部份資金來自DGLFLF(法語及法國語言總代表團,英語:General Delegation for the French language and the languages of France)。該專案的第一個版本於2016年8月推出。當時僅適用於錄音,Lingua Libre在2016年12月的奥克语工作坊上展示,[7][8]然後呈現給線上維基媒體社群[9],也於2017年的國際活動上展示。

Lingua Libre v.2 (2018)

2017年底全面重建。新版Lingua Libre是以MediaWiki為基礎,使用WikibaseOAuth以便更好地融入維基媒體環境。其介面透過Translatewiki.net翻譯,因此該專案可被大量社群使用。新版的網站於2018年6月準備就緒[10],並於2018年8月向大眾開放。

Lingua Libre v.2.2 (2020)

2020年,平台發生重大變化;有了專為該網站開發的新外觀,而.org網域也取代了先前使用的.fr網域。[11]Lingua Libre現在支援透過視訊錄製手語

統計資料

 
2017年在蒙特婁時與一位講阿提卡米克语的人一起錄音。

在專案啟動的前兩年,大約製作了一萬份的錄音。向v.2的過渡也同時伴隨著貢獻的快速增加。在不到一年的時間內,錄音的數量增加超過十倍,於2019年5月時就超過十萬份,這些錄音是由127位貢獻者以近50種語言錄製的。[12]到了2020年9月,該平台已有90種語言的超過三十萬份錄音,貢獻者超過350人。2021年6月達到了五十萬份錄音的里程碑這要歸功於120種語言的540名貢獻者。[13]

參見

參考資料

  1. ^ 1.0 1.1 Sabine Buchwald. Wie Wikipedia Bairisch lernt. Süddeutsche Zeitung. 2019-08-04 [2022-08-21]. (原始内容存档于2023-01-18) (德语). 
  2. ^ France : un incendie se déclare au datacenter OVHcloud de Strasbourg. Wikinews French. 2021-03-11 [2022-08-21]. (原始内容存档于2022-08-08) (法语). 
  3. ^ Lingua Libre 2.3 - Phoenix Edition ǃ. Meta-wiki. 2021-03-19 [2022-08-21]. (原始内容存档于2021-05-07). 
  4. ^ GoldenDict: Dictionary with Wikipedia integration - gHacks Tech News. 2017-07-10 [2022-08-21]. (原始内容存档于2022-06-26). 
  5. ^ Modèle français 0.4 pour DeepSpeech v0.6. Mozilla Discourse. 2020-03-10 [2022-08-21]. (原始内容存档于2022-08-21). 
  6. ^ Rémy Gerbet, Lingua Libre : un nouvel outil collaboratif pour le public et les chercheurs, Culture et Recherche, 2018-05-14, (137): 52 [2022-08-21], ISSN 1950-6295, (原始内容存档于2022-08-20) (法语) 
  7. ^ French Ministry of Culture. Oc-a-thon 2016 : deux journées contributives sur l'occitan les 9 et 10 décembre. 2016-11-16 [2022-08-21]. (原始内容存档于2020-08-03) (法语). 
  8. ^ Mathieu Denel. L'oc-a-thon, un edit-a-thon pour enrichir les projets Wikimedia et Lingua Libre en langue occitane. Wikimédia France Web Blog. 2016-12-21 [2020-12-03]. (原始内容存档于2023-01-16) (法语). 
  9. ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2017-08-01 [2020-12-02]. (原始内容存档于2022-07-05) (法语). 
  10. ^ French-speaking Wiktionarists. Lingua Libre. Actualités du Wiktionnaire. 2018-07-01 [2020-12-02]. (原始内容存档于2022-08-21) (法语). 
  11. ^ Sara Krichen. Lingua Libre fait peau neuve !. Wikimédia France Web Blog. 2020-06-02 [2020-12-02]. (原始内容存档于2022-11-29) (法语). 
  12. ^ Miguel Trancozo Trevino. The many languages missing from the internet. BBC.com. 2020-04-15 [2022-08-21]. (原始内容存档于2023-01-18). 
  13. ^ Lingua Libre's statistics page

外部連結