中國語言資源保護工程
中國語言資源保護工程,簡稱語保工程,由中華人民共和國教育部、國家語言文字工作委員會自2015年啟動的語言文化類保護工程,包含了在全國範圍內以語言資源調查、保存、展示和開發利用等為核心的各項工作,其目的是推廣和規範使用國家通用語言文字,保護各民族語言文字,落實《國家中長期語言文字事業改革和發展規劃綱要(2012-2020年)》的任務要求。[1]
目標
利用現代化技術手段,收集記錄漢語方言、少數民族語言和口頭文化的實態語料,進行整理和加工,建成大規模、可持續增長的多媒體語言資源庫,並開展語言資源保護研究工作,形成系統的基礎性成果,進而進行深度開發應用,全面提升中國語言資源保護和利用的水平,為傳承中華優秀傳統文化、促進民族團結、維護國家安全服務。[1]
實施基礎
教育部、國家語委從2008年起,先後在江蘇、上海、北京、廣西、遼寧、福建、山東、河北、湖北等省份開展了中國語言資源有聲數據庫建設試點工作,這些試點工作檢驗了有聲數據庫建設技術規範和工作規範的科學性和可行性,完善了中國語言資源庫的建設方案。[1]
一期建設
語保工程於2015年啟動,至2019年一期建設順利完成,為期5年。[2]
已出版《中國語言文化典藏》(20卷)和《中國瀕危語言志》(30卷)。[2]
語言調查地區覆蓋了全國34個省區市,共1712個調查點,收集到123種語言和全部漢語方言。建成了世界上規模最大的語言資源庫並提供在線服務,其採錄展示平台收錄了9733位發音人,原始語料數據1000多萬條,其中音視頻數據各500多萬條,總容量100TB。[2]
二期建設
二期建設自2021年啟動,以做好頂層設計、加強開發應用、壯大人才隊伍作為推進工程二期建設的重要途徑。[2]