互聯網語言學

互聯網語言學(英語:Internet linguistics)是語言學下屬的一個分支,由英國語言學家大衛·克里斯托所提出。該學科研究因互聯網和其他的一些新媒體(諸如短訊)等產生的影響從而導致的新型的語言風格和語言結構。[1][2] 人機互動(HCI)引發了人們對於電腦輔助溝通(CMC)和互聯網輔助溝通(IMC)的探討。通過探索網絡介面及其可使用性,人們了解到了語言學對此研究的建設性作用。通過學習互聯網上的新興語言,人們可以拓寬對團體的概念,改善翻譯質素和網絡體驗。因此,互聯網語言學將能夠使得語言學家和用戶同時受益。[3]

互聯網語言學的研究可分為以下四個大方向:社會語言學,教育,語言風格以及應用。在技術的發展下,這幾個方向又發展出幾個子分支。隨着互聯網使用人數增多,互聯網未來的語言學也充滿了可能性。新的CMC方式持續出現,人們也將改變自己的說話方式來適應這些變化。[4]互聯網本身亦將鼓勵用戶積極使用新興的語言,並在其基礎上大膽創新。[5]

主要方向

大衛·克里斯托已經為未來的研究確立了四個主要的研究方向,分別為社會語言學方向, 教育方向,語言風格方向,以及應用方向。 這四個方向相互交織並互相影響。

社會語言學方向

這個方向主要研究的是社會如何看待網絡語言。 互聯網的發展已經在人與人之間的溝通上做出了重大的變革。它改變了人們交流的方式,並提供了新的、對社會造成深遠影響的平台。這其中短訊電子郵件聊,虛擬世界以及互聯網本身等,都對此貢獻巨大。

這些新的傳播媒體已經引發了人們對於語言使用上的擔憂。 據克里斯托在2005年的研究,這些擔憂並非空穴來風或是前無古人。每當技術取得重大突破,並且因此影響到語言的時候(比如15世紀的印刷術,19世紀電話的發明,以及20世紀無線電在民間的推廣)這種對於語言使用的擔憂就會出現。

對個人而言,像短訊或是郵箱客戶端(Push Mail)一類的CMC溝通方式已經極大地改善了即時通訊。[2] iPhone黑莓手機等都是例子。

在學校中教師和學生常常也會使用校方的郵箱相互聯絡。課堂討論也經常線上討論區中進行。 比方說,在南洋理工大學,學生使用校方的平台edveNTUre進行討論,線上測驗,觀看教師準備的即時線上課程等。在2008年,iTunes U與大學合作,將Apple音樂服務移植到一個特別的商店。 在該商店觀看線上學術課程以及取得學術材料免費。目前已經與在18個國家超過600家學術機構有了合作,其中包括牛津大學劍橋大學以及耶魯大學[6]

在全世界許多教育工作者們都開始尋找新思路來和學生更好地交流時,這種學術社交網絡和社交媒體開始逐漸吃香。紐約大學的學生們時常通過Skype與客座演講嘉賓互動,和提供即時通訊的圖書館工作人員聯絡,從校外取得學校圖書館相關資源。[7] 師生開始使用新的CMC平台,這些都會關係到語言的使用。

在專業的水準上來看,公司普遍都會將電腦或筆記本與互聯網連接(通過有線或無線的網絡連接),並分配給員工獨立的電子郵件帳戶。這極大程度上幫助了公司內部(員工之間)和外部(公司或組織之外的團體)的交流。諸如智能電話之類的流動端的交流方式亦參與到了全世界的協同運作當中。

總體來看,這些因互聯網而生的新興CMC系統已經改變了人們使用語言的方式。語言越來越非正規,因此人們對其惡化的恐懼越來越大。 然而,如同David Crystal指出的那樣,從積極的角度看來這也反映了語言的創造性。[2]

主題

互聯網的社會語言學也可以依照五個相互交織的主題分類進行研究。[8]

  1. 多語制:探討不同語言在互聯網上的流行度,以及其現狀。
  2. 語言變化:從語言學的角度來講,語言變化受其實體層面傳播的方式(如:打字)以及變換的社會經濟優先度(如:全球化)的影響。語言變化探尋語言,尤其是網絡語言,隨着時間而產生的變化。
  3. 對談分析:探討在互聯網上的社互動動以及交流行為的樣式的變化。
  4. 文體發散:涉及到研究網絡語言以及其有關的語言學形式在現實生活中的應用問題。語言在發展變化的時候,對談分析和文體發散都會和語言風格方向的研究互相交集。
    參見以下:語言風格方向
  5. 元語言民俗語言學:觀察語言的形式與變化在互聯網上是如何被標出並討論的。(如:網絡語言的衝擊使得英文中單引號和大小寫等不再被規範使用,或者中文中標點符號被空格所代替等。)

教育方向

互聯網語言學的教育方向則探討了互聯網在形式語言的使用上造成的衝擊。對於標準語的使用在這裏則尤為受到關注,因為這也影響到了語言教育的層面。 互聯網的快速崛起已經為互聯網平台帶來了其獨有的語言學特徵。這些包括但不限於,非正式書面語言的加劇使用,書面語風格的前後不統一,以及在互聯網和短訊中出現的新的簡寫方式。 這種首字母縮略字的出現主要是出於實用的目的:為了減少在這些平台上溝通交流時花費的時間和精力。此外,技術層面的限制也給這些溝通帶來不便。 常見的簡寫有LOL(英文意為laughing out loud,大笑)、OMG(英文意為oh my god,表示感嘆)、GTG(英文意為got to go,我得走了)。[9]中文中類似的有886(拜拜了,擬聲)。

在「對於互聯網對於語言教育的影響」的相關研究中,互聯網語言學的教育方向有着廣泛的應用。 這是一個至關重要的方向,因為其涉及到了對於下一代的教育。在互聯網上出現的非正式語言需要考慮到其合適的使用時機。社會上出現了一些對於非正式語的不當用法的擔憂,尤其是在學術及其他正式場合上,比如在學術報告中使用「那傢伙」(guy)等。教育工作者們也注意到了一些頻繁的拼寫或者語法錯誤。 [10]

埃莉諾·約翰遜等語言學家認為,那些使用廣泛的語言錯誤與互聯網的使用有着密不可分的聯絡。教育工作者也同樣從學生的作業中看到一些新種類的拼寫和語法錯誤。然而,人們沒有科學的證據來證實這種關聯性。[11]雖然人們有理由懷疑,互聯網的使用對學生的學術寫作及正式的書面語言的使用造成了一定的影響,但是其嚴重性則毫無疑問被這種新形式的平台擴大化了。Naomi S. Baron(2008)在其著作《Always On》中稱,學生的寫作幾乎不受到IMC(互聯網輔助溝通,比如網絡聊天,短訊,電子郵件等)的影響。[12]最近的一項由英國發展心理學雜誌上發表的研究顯示,經常傳短訊的學生(指通過使用手機短訊的功能傳送訊息)顯示出更廣泛的詞彙量,這可能會對他們的閱讀技巧產生積極的影響。[13]

儘管互聯網的使用導致了在學術和形式語言使用方面不適當的風格,但需要注意的是,互聯網的使用可能不會妨礙語言教育,反而有助於它。 互聯網已經在多方面證明了它可以增強語言的學習,特別是在第二語言或語言教育方面所具有的潛在的優勢。通過互聯網進行的語言教育與互聯網語言學的關係主要通過溝通交流的方式顯現出來(電子郵件的使用,線上交流平台,即時通訊網誌等)。 [14]通過一些特殊的技巧,比如以爭論及說服的方式,IMC使得語言學習者和說母語的人之間的交流更加頻繁,提供了更多的語言錯誤修正的幫助,以及更好的學習機會。

語言風格方向

該方向探討了互聯網及其衍生的技術如何鼓勵語言, 尤其是文學作品上的創新。[2]它將互聯網視作新語言現象發展的媒介。這種新的語言形式是一項有趣的研究,因為它是口語和書面語的一種融合的形式。比方說,傳統的書寫方式,較之於互聯網上字型的顏色、大小不一的動態形式,要更為靜態一些。[15]然而,這種新的語言模式也同時存在一些在自然語言中並不存在的元素,比如在電子郵件或討論區中「框架」的概念。在回覆電子郵件的時候,人們基本上會使用發件人的電子郵件內容作為他們自己的回覆的框架結構,也可以選擇回覆一部分而略去其他的。在線上討論區中,用戶可以發起一個新的主題,而其他人無論身在何處都能夠通過互聯網對這個主題提出自己的看法。這種現象在書寫語言中通常是見不到的。[15]

進一步的研究顯示,互聯網及其相關技術在不斷創造着新的陳述式的表達方式,並且這些新的形式不僅僅在書面語上有所體現,人們也同樣在口語表達中觀察到了這些變化帶來的影響。[2]人們最常從下列幾個CMC通訊方式中觀測到網絡語言的交流風格,因為這些通訊方式經常試圖逾越技術上的限制(比如通訊滯留),並重新建立那些無法用書面語清晰表達的社交線索。[8]

流動電話

流動電話(又稱「手機」)擁有一些超過其本身通訊功能的用途。比如衛報舉辦的短訊大賽。[2]因為手機短訊有160個字元的限制,用戶開始竭盡其所能地發揮自己語言上的創意來攻克這一難關。推特是一個類似的有字數限制的新技術發明,其限制為280個字元。人們對此曾有過爭論,用戶發表的的推特究竟是因為「懶」,還是說這是是充滿創意的碎片化溝通方式。雖然爭論仍在繼續,但毫無疑問的是,推特推動了語言學,發展出了新的網語,並將溝通帶上了一個全新的維度。[16]

手機也創造了一個新的文體:手機小說。一個典型的手機小說通常包含幾個能夠快速下載的章節。這些小說通常都很「質樸」,因為它們沒有像傳統的小說作品那樣的編輯的過程。它們像短訊那樣用短句子寫成。[17]通過電子郵件或一些線上平台,這類小說的作者同樣也可以從讀者那裏獲得反饋。和傳統的小說寫作不同,讀者的想法有時會被融入到故事當中,或者作者也會按照讀者的需求或者是作品人氣(一般按照下載量來測算)等考慮改變故事劇情。[18] 雖然手機小說很受歡迎,但是也有人批評該類型小說「缺乏詞彙量」並且及語法不通。[19]

網誌

網誌被認為是新型的寫日記方式,並且從語言學的角度來看,網誌中所使用的語言處於「其最『赤裸』的形式」,[2]因為網誌在沒有經過正式的編輯過程便公開發表。這使得網誌在其他絕大多數經過編輯等標準化處理程式的書寫語言中鶴立雞群。[20] 大衛·克里斯托稱,網誌是「書面語言革命的新起點」。[2]網誌廣受歡迎,因而其已經發展出了超越書寫網誌的形式,[21]出現了 圖片網誌英語Photoblog影片網誌,以及音頻網誌。這種互動式網誌的發展帶來了新的語言學的傳統以及風格,並在未來會持續發展。[20]

虛擬世界

虛擬世界的討論包括了用戶如何將自然語言的交流帶入這些新媒介的相關觀點。網絡語言已經在文字聊天室,以及電腦模擬的世界中,發展出了數字社區之中的黑話,如Pwn以及菜鳥等。表情符號則體現了用戶如何適應受限的、「毫無表情」的網絡交流環境並表達情緒。[22]

諸如角色扮演類的遊戲(RPG)以及虛擬世界等非常具有互動性,強調速度、簡潔以及同步性。於是,CMC便變得更加充滿活力、變化多端、不拘形式且開放自由。日常對話中經常出現複雜的序列以及互換的結構。一些常見的CMC方式有字母全大寫(「EMPHASIS」),用星號將一個詞包裹起來等對於符號的使用(「*stress*」),以及創造性地使用標點符號(「???!?!?!?」)。[8]標點符號也同時被用在對談上,比如星號被用作對談修復英語Conversation analysis#Repair,以及箭頭符號被用來指代、參照等。[23][24]除了對這些新語言形式作出的貢獻之外,虛擬世界也被用來教授語言。虛擬世界語言學習英語Virtual world language learning為學生模擬了真實的生活環境,允許他們發揮自己的創意來提高語言的姿勢水平。對於年輕的語言學習者而言,虛擬世界也是個非常好的工具,因為他們已經認為這些地方是「再正當不過的學習和玩的地方」。[25]

電子郵件

在語言風格方向下的一個最為流行的互聯網相關的技術是電子郵件。電子郵件在很多方面都拓寬了語言的風格。一份研究電子郵件的語言學的報告指出,電子郵件是口語與書面語言形式、語法、文風的混合。[26]得益於其便捷、速度以及即時性,電子郵件正快速取代傳統的信件。[27]它常常被認為是不正式的,因為人們覺得它是臨時的,很容易被刪除。然而,當這個通訊平台逐漸成熟的時候,電子郵件卻不再被用作在親朋好友之間傳送一些不正式的資訊。相反地,電子郵件被越來越多地用作商務上的合作。求職者也常常用電子郵件給他們潛在的招聘者投簡歷。這種向正式語遷移的過程使得電子郵件成為了介乎於正式語和非正式語之間的一種文體。[20]

雖然說,曾有人責備學生因為電子郵件的緣故,書面語寫得很不整經,大衛·克里斯托辯稱,電子郵件「對於語言教育絕不是一種威脅」,因為電子郵件的排版更加有表達性,語言學習者可以在語言上做出自己的選擇。此外,年青一代也可以用電子郵件來提高自己的寫作及溝通方面的技巧,因為他們需要花精力透過這種電子的傳播方式來慢慢地推敲自己的想法。

即時通訊

和其他形式的線上通訊方式一樣,即時通訊也發展出了自己的縮寫、簡寫的方式。然而,即時通訊和電子郵件、群聊有所不同,因為它使得溝通的參與者可以與對方進行即時的聯絡,同時保證了對話的私密性。[28]即時通訊的使用為參與者之間增添了一絲親密感,而這份增長的親密感則帶來了更多的隨意性。同時,即時通訊的文體風格也更加多變,因為參與者的年齡跨度會很大。比方說,一個孫女和她奶奶利用即時通訊進行聯絡。和參與者喜好大體一致的群聊不同的是,這裏對於語言協調上的要求很少。[20]

應用方向

 
來源: http://www.internetworldstats.com/stats7.htm 頁面存檔備份,存於互聯網檔案館) Internet World Stats

應用方向從溝通能力的角度來審視互聯網的語言學上的開發——包括好的方面與不好的方面。[1]互聯網提供了一個多語言的平台。雖說英語依舊是互聯網的主要語言,互聯網上其他語言的用戶也在不斷地增加。[8](對於語言、國籍、地理位置的詳細的數據,參見全球互聯網使用率)當更多的不同語言的社區加入到互聯網之中時,這種多語言的環境也持續增加其多樣性。因而少數族裔與瀕危語言用戶能夠在互聯網上使自己的語言重新煥發生機,並增加語言的存在感。語言檔案編制以及語言復興則是互聯網為這類語言提供的機會的兩個例子。[1]

語言檔案編制

首先,互聯網有助於語言檔案編制。例如音頻、影片等數碼化的存檔方式不僅僅有助於語言檔案編制,也同時有助於語言通過互聯網在全球進行傳播。[29]韋氏詞典(2003)等將瀕危語言公開的行為使得全球對語言檔案編制產生了興趣。

語言復興

第二,互聯網有助於語言復興。多年來,數字環境已經發展出了不同的複雜的方式來實現虛擬接觸。從電子郵件、聊天軟件到即時通訊,這些虛擬環境已為聯絡的雙方建起了跨越空間的橋樑。此外,年青一代認為很「酷」的數碼技術會吸引他們,並因此維持他們對於母語的興趣,以及對母語的使用。[1]

開發互聯網

互聯網也同時會被恐怖主義互聯網詐騙戀童等活動所利用。最近,因為容易匿名的緣故,通過電子郵件和IRC等使用互聯網進行的犯罪變得更加頻繁。[30]這些不法分子的陰謀帶來了安保工作上的擔憂。從司法的角度來講,互聯網還有很大的可能性尚未能夠探索。雖說利用內容控制軟件進行關鍵詞過濾很有效,但幾乎沒有以語言學為出發點對此進行的研究。另一方面,語意網則被用作個人數據保護英語Information privacy來試圖避免詐騙行為。[31]

互聯網語言學的尺度

這一小節所討論的尺度問題包含了將網絡語料庫以及語言的鑑別與正規化的問題。互聯網語言學對日常生活的衝擊將從網絡語言風格的傳播與影響、互聯網上的語言變化趨勢以及談話的方面進行分析。

網絡語料庫

互聯網是一個用來儲存數據以及資源的巨大儲存庫。語言學家與語言技術專家越來越多地轉而利用網絡來尋求語言方面的數據。[4]語料庫(Corpora)第一次在計算語言學領域被提起,是在1989年溫哥華的ACL會議上。因為理論不完整的緣故,它當時在有關領域引起了極大的爭議。刊物「Using Large Corpora」(中文為《大語料庫的使用》)的出版為鬥爭畫上了句號,[32]並且使得計算語言學與語料庫的關係得到了廣泛的認可。[4]

為了確認網絡是不是一個語料庫,人們通常會使用麥克恩利(McEnery)與威爾森(Wilson)給出的定義(1996年,第22頁)。[33]

原則上來講,任何多於一個字元的集合都可以被稱作一個語料庫……但是在現代語言學背景下,「語料庫」一詞常常暗示了這一簡單定義所不具備的東西。這些包括如下四個方面:樣本與代表性、有限的大小、可供機讀的形式、一個標準的參照。
—  Tony McEnery and Andrew Wilson, Corpus Linguistics

曼寧(Manning)和舒策(Schütze)(1999年,第20頁)提出了與網絡語料庫更接近的一個定義[34]

在統計性的NLP(自然語言處理)中,人們通常在沒有關注到其如何形成的情況下,將某個關注領域中所得到的特定量的數據視作語料庫。在這種情況下,更多的訓練數據比任何對於平衡性的研究更加有益,而人們應該利用所有可取得的文字(作為訓練數據)。
—  Christopher Manning and Hinrich Schütze, Foundations of Statistical Language Processing

主題

網絡語料庫的發展可能性被廣泛地討論着。2002年的EU Meaning計劃中,人們對利用網絡作為數據來源對字詞進行消歧義(也就是多義詞的辨析)的進展進行了討論。[35]這假設了在一定的討論範圍之內,一個單詞通常只有一個理解方式。而這裏所說的「討論範圍」一般可以利用互聯網來進行確認。人們在Word Expert Web利用互聯網科技進一步探索了這種手動添加註釋的方式。

語言模型的領域,網絡被用在解決數據稀疏的問題。人們收集字典的統計數據,並利用這些數據來解決介詞字尾的問題,[36]而同時網絡中的文件數據則被用於維持語料庫的平衡。[37]

在資訊採集方面,網絡軌道被整合成社區的TREC(文字資訊檢索)評估的一部分。用於此目的的網絡樣本大約累計有100GB左右,主要由.gov這一頂級域名中的文件所構成。[38]

英國國家語料庫

英國國家語料庫英語British National Corpus包含了構成英文核心的一萬個單詞的主要含義與用法規律的大量資訊。

英國國家語料庫的單詞量對於語言學家與詞典編輯的經驗策略學習來說足矣,[4][39]並且對於那些利用量化的資訊來分析輸入文字的技術(指解析,英文:parsing)來說也已經足夠應付了。[40][41]然而因為單詞的分佈遵循齊夫定律的關係,對於其他的目的而言,英國國家語料庫還遠遠不夠。鑑於在英國國家語料庫種有大量的詞彙出現少於50次,對於這類詞彙我們無從得出統計上相對穩定可靠的結論。此外,對於一些更加生僻的詞彙,常見詞彙的生僻含義,以及詞組等,目前我們仍然缺乏數據。研究人員發現,由大量數據得出的概率模型比那些少而乾淨的數據得出的概率模型結果要更好一些。[4]

多語言網絡

網絡很顯然是一個多語言的語料庫。[42]據估計,50.2%的網民來自亞洲,17.1%來自歐洲,10.4%來自拉丁美洲/加勒比海,9.1%來自非洲,8.7%來自北美洲,3.8%來自中東地區,0.7%來自大洋洲。[43]

搜尋一整個單詞,比如「深呼吸」,在AlltheWeb搜尋引擎上返回了868,631個網頁。通過搜尋引擎得到的資訊是搜尋英國國家語料庫得到的資訊的三倍。這暗示了網絡中英文語料庫的實際大小。

透過控制那些不同語言的語料庫以不同比例混合的數據進行的分析,人們也從此看出網絡上存在的巨大的文字資訊。網絡語料庫是如此巨大,若是利用它作分析,其強度與準確性將不容小覷。英國國家語料庫也同時在試圖利用互聯網來擴充自己收錄內容的大小。[4]

面臨的挑戰

在語言建模的領域中,任意一個語言模型都會產生應用方面的限制,因為不同種類的文字,其統計數字也會不同。[44]當一個語言技術被使用的時候(被應用到一個新的文字種類中時),人們無從確定這個語言模型所產生的結果和訓練該語料庫時產生的結果是否一致。人們發現,當訓練用的語料庫發生變化時,語言模型的表現形式也會不同。[45]缺乏理論基礎限制了語言模型的實用價值。

鑑於創作網絡語言在時間和花費上都很少,並且是多人協同運作的形式,很少有人會在乎它是否準確。語法、拼寫錯誤導致網絡語料庫「傷痕累累」。然而,儘管有些噪音,網絡語料庫依然可能大有用途。[4]

人們仍在討論亞語言英語Sublanguage是否應當被囊括進去的問題。贊成的人認為,倘若從模型中去掉那些亞語言,得出的將會是一個缺東少西的語言模型。鑑於語言由字典詞彙、語法以及大批次的亞語言構成,這些亞語言應當被囊括進語料庫中。然而,最近人們開始對此提出異議。將這些亞語言直接帶入語料庫中的做法引起了人們的爭議,因為無從得知哪部分亞語言應當被收入,哪部分不應當被收入。[4]

語料庫的內容主要取決於語料庫的開發者,目前這些開發者主要從實用主義的角度去出發。[4]在「代表性」的要求被換成「平衡性」之後[4],英國國家語料庫的標準能夠滿足人們大多數的需求。[46]

諸如Google之類的搜尋引擎已經變成了訪問互聯網海量資源的不二法門。然而,對於那些從事語料庫相關研究的語言學家來說,這帶來了一些挑戰,比如這些引擎智只能提供受限的資源(最多1000或5000),不足量的語境的問題(谷歌只提供大約10個單詞的隻言片語),搜尋結果被(從語言學的角度看來)人為地扭曲了(標題佔了很大的權重),沒法從語言學的標準來搜尋想要的詞彙(因為搜尋排序的問題)。目前最好的解決方式是語言學家自己動手豐衣足食。[4]

代表性

雖說資源充沛,但網絡並不能代表全世界所有的語言。網絡不是世界上所有語言的語料庫,反過來世界上所有的語言也不是互聯網的語料庫。然而,人們從多種多樣的語言的互聯網出發進行進一步的探討,也是研究語料庫的一個好的開始。[4]

傳播與影響

互聯網的使用所帶來的語言風格的變化已經滲透到了其他的領域,包括但不限於電影音樂文學作品。互聯網的語言風格很重要,因為有大量的人們參與進來,強化某些不為正式語言所接受的網絡用語風格。

除了網絡上流行的黑話外,語法錯誤、拼寫錯誤也是網絡語言和其他CMC溝通的特色。當網民逐漸適應這些錯誤之後,它將從書面語與口語兩方面同時不斷地滲透到日常語言的使用中。[1]在大眾媒體中這些錯誤十分常見,從新聞中的拼寫錯誤到廣告中的語法錯誤,甚至還有話劇對白中的網絡黑話。

互聯網與日常生活越緊密,其對正式語言的影響就越深。智能電話、平板、社交媒體的普及更加印證了這一點。學生們受到了網絡語言前所未有的衝擊,因此網絡語言的語法結構、黑話滲透到了他們正式的書面語言當中。完全浸入式的學習永遠是學習一門語言的最好的方式。馬克·萊斯特在其著作《Teaching Grammar and Usage》中稱,「學習基礎寫作的人們最大的語法錯誤問題在於他們沒有接觸到足夠的正式書面語……我們應當這樣想,不能期望一個沒有接觸過外語的學生能夠熟練掌握這門外語。」[47]鑑於學生們大量接觸網絡語言,網絡語言的形式與結構自然而然地成為了他們學習的對象。

大眾媒體

 
由中國網絡語言「厲害了,我的哥」衍生出的「厲害了,我的國」標語貼紙

有些電視廣告也會使用網絡語言,這加劇了網絡文風對日常生活的滲透。比方說,AT&T在美國的廣告中使用了「BFF Jill」(「Best Friend Forever, Jill」,意為「永遠的最好的朋友,Jill」)等簡寫方式。因為互聯網「原住民」的團體正在日益壯大,越來越多的商家將網絡語言植入到他們的廣告當中,以期能夠帶來更多的共鳴。[48]這類的廣告已經從他們的受眾中獲得了相對熱情的反響。[48]

網絡語言的使用也同樣滲透到了音樂的領域,其中流行音樂特維尤甚。比如Trey Songz歌曲《LOL :-)》的歌詞包含了許多網絡語言,並提及了推特以及短訊[49]

網絡語言也同時出現在獨立製片者和商業電影之中。雖說一般獨立電影只在電影節有展映,但是獨立電影發行的DVD則可通過在網上付費觀看,因而使得大眾更容易接觸到這些影片。[50]商業影片則直接在一線影院面向大眾,導致網絡語言的傳播更加迅猛——比如一個名為《LOL》的電影,主打Miley CyrusDemi Moore[51]這部電影是2008年法國電影《LOL英語LOL (Laughing Out Loud)》的重製。[52]

中文的網絡語言用戶中也有類似的現象。央視在2017年1月28日的新聞聯播中使用了「厲害了,我的國」的字樣,改編自中國2016至2017年的網絡語言「厲害了,我的哥」。[53]

互聯網語言學的未來

隨着資訊科技的更新迭代,人們也為這越來越複雜的技術做好了準備,有可能會改變自己的語言使用習慣以適應這日新月異的通訊方式。[4]互聯網使用人數的增加使得文化背景差異、不同的語言習慣被加速帶入到互聯網之中。這些個體的差異會為互聯網語言學的未來——尤其是在多語言的網絡環境中——帶來重大的變革。從2000到2016年,互聯網在非英語國家,如中國、印度、非洲等,有了極大的滲透率,[54]使得除了英語外的更多語言滲透到互聯網中來。因此,英語與其他語言的互動被認為是一項重要的研究領域。[55]全球化加快了各語言的相互連接,使得新的網絡文風跨語言進行傳播。中文和韓文已經感受到了英文對他們網絡語言進行的滲透,參與到了多語言的網絡語言形成中。[56]

現在,互聯網提供了一種教育、推廣少數語言的方式。然而,和滲入中文、韓文的英文導致了新的網絡黑話的過程類似,[56]少數語言也受到那些在互聯網上更常見的語言的影響(英文、西文、中文等)。不僅僅語言間的互動會導致少數語言使用不規範,對於優勢語言的熟知也會從不好的方面影響到那些少數語言。[5]比方說,試圖學習少數語言的人們可能會閱讀用多數語言寫成的典籍並止步於此,結果導致說少數語言的人不增反減[57]同時,人們可能鼓勵那些原本說少數語言的人去學習多數語言,以便能夠上網去尋求更多的資源,結果導致自己原本所使用的語言的流失。[58]人們仍需進一步觀察那些瀕危少數語言的未來在互聯網上的傳播。

參見

參考資料

  1. ^ 1.0 1.1 1.2 1.3 1.4 Language Development via The Internet. ScienceDaily. 2005-02-28 [2017-02-12]. (原始內容存檔於2020-02-16). 
  2. ^ 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 Crystal, David. The Scope of Internet Linguistics (PDF). paper presented at the American Association for the Advancement of Science meeting. 2005 [2017-02-12]. (原始內容 (PDF)存檔於2011-07-26). 
  3. ^ Martín del Pozo, Maria Angeles. Linguistics and web usability; Research Paper. No Solo Usabilidad (Not Just Usability). 2005-05-08, 4 [2014-02-15]. ISSN 1886-8592. (原始內容存檔於2019-08-14). 
  4. ^ 4.00 4.01 4.02 4.03 4.04 4.05 4.06 4.07 4.08 4.09 4.10 4.11 4.12 Kilgarriff, Adam; Grefenstette, Gregory. Introduction to the Special Issue on the Web as Corpus (PDF). Computational Linguistics (MIT Press). September 2003, 29 (3): 333–347 [2017-03-14]. doi:10.1162/089120103322711569. (原始內容 (PDF)存檔於2012-03-04). 
  5. ^ 5.0 5.1 Cunliffe, Daniel; Herring, Susan C. Introduction to Minority Languages, Multimedia and the Web. New Review of Hypermedia and Multimedia (Informa world). December 2005, 11 (2): 131–137 [2010-11-12]. doi:10.1080/13614560512331392186. (原始內容存檔於2020-04-14). 
  6. ^ Cohen, Peter. iPhone Takes on the BlackBerry. PC World. 2008-03-07 [2010-10-31]. (原始內容存檔於2009-10-07). 
  7. ^ Cohen, Peter. Universities Use Social Media to Connect. The New York Times. 2010-03-30 [2010-10-31]. (原始內容存檔於2019-12-07). 
  8. ^ 8.0 8.1 8.2 8.3 Thurlow, Crispin. The Internet and Language. Mesthrie, R.; Asher, R. (編). Concise Encyclopedia of Sociolinguistics (PDF). London: Pergamon. 2001: 287–289 [2010-11-09]. ISBN 0-08-043726-5. (原始內容 (PDF)存檔於2012-10-08). 
  9. ^ Nazaryan, Ani; Gridchin, Aleksandr. The Influence of Internet on Language and "Email Stress" (PDF). Law and Politics. 2006, 4 (1): 23–27 [2010-10-19]. (原始內容 (PDF)存檔於2016-03-03). 
  10. ^ Hayslett, Chandra M. No LOL Matter: Cyber lingo shows up in academia. The Seattle Times. 2006-11-26 [2010-11-06]. (原始內容存檔於2011-06-22). 
  11. ^ Abrams, Rachel. Experts divided over Internet changes to Language. VOANews. 2010-01-16 [2010-10-19]. (原始內容存檔於2012-04-14). 
  12. ^ Naomi, S. Baron. Always On. Oxford University Press. 2008. ISBN 0-19-531305-4. 
  13. ^ Texting 'improves language skill'. BBC. 2009-02-25 [2010-11-04]. (原始內容存檔於2020-11-09). 
  14. ^ Xie, Tim. Globalization and Language Education. Presentation. June 2008 [2010-10-19]. (原始內容存檔於2011-07-23). 
  15. ^ 15.0 15.1 Cook, Franklin. Linguists See Internet Lingo as Cultural Catalyst. yourdictionary.com. 2001 [2010-11-08]. (原始內容存檔於2010-02-13). 
  16. ^ Clark, Roy Peter. From Telegraph to Twitter: The Language of the Short Form. Poynter Online. 2009-09-04 [2010-10-21]. (原始內容存檔於2010-01-19). 
  17. ^ Onishi, Norimitsu. Thumbs Race as Japan’s Best Sellers Go Cellular. The New York Times. 2008-01-20 [2010-11-07]. (原始內容存檔於2020-11-05). 
  18. ^ Cell Phones Put to Novel Use. Associated Press. 2005-03-18 [2010-11-08]. (原始內容存檔於2013-10-30). 
  19. ^ Galbraith, Patrick W. Cell phone novels come of age. Metropolis Magazine. 2010 [2010-11-08]. (原始內容存檔於2009-10-15). 
  20. ^ 20.0 20.1 20.2 20.3 Crystal, David. Language and the Internet. Cambridge University Press. 2006. ISBN 978-0-521-86859-4. 
  21. ^ Francisco, San. Success of blogs heralds an even bigger future. The Age (Melbourne). Associated Press. 2003-03-18 [2010-11-10]. (原始內容存檔於2016-05-30). 
  22. ^ Cicognani, Anna. On The Linguistic Nature of Cyberspace and Virtual Communities. Virtual Reality (Springer). 1998, 3 (1): 16–24 [2010-11-06]. doi:10.1007/BF01409794. [永久失效連結]
  23. ^ Collister, Lauren B. The discourse deictics ∧ and <-- in a World of Warcraft community. Discourse, Context & Media. 2012-03-01, 1 (1): 9–19. doi:10.1016/j.dcm.2012.05.002. (原始內容存檔於2013-02-21).  
  24. ^ Collister, Lauren Brittany. *-repair in Online Discourse. Journal of Pragmatics. The Language of Space and Time. 2011-02-01, 43 (3): 918–921 [2017-03-09]. doi:10.1016/j.pragma.2010.09.025. (原始內容存檔於2015-11-10).  
  25. ^ Language Teaching Gains Second Life: Virtual Worlds Offer New Methods to Teach Languages (新聞稿). Avatar English. 2007 [2010-11-08]. (原始內容存檔於2014-10-29). 
  26. ^ Baron, Naomi S. Letters by phone or speech by other means: the linguistics of email (PDF). Language and Communication (London: Pergamon). 1998, 18 (2): 133–70 [2010-11-08]. doi:10.1016/S0271-5309(98)00005-6. (原始內容 (PDF)存檔於2009-12-29). 
  27. ^ Olsen, Stefanie; Suri, Sabena. Say so long to traditional letter writing. CNET News. 2007-08-24 [2010-11-10]. (原始內容存檔於2012-10-26). 
  28. ^ The EDUCAUSE Learning Initiative. 7 Things You Should Know About Instant Messaging (PDF). 7 Things You Should Know About... (EDUCAUASE Learning Initiative). November 2005 [2010-11-10]. (原始內容 (PDF)存檔於2011-01-05). 
  29. ^ Johnson, Heidi. Language Documentation and Archiving, or How to Build a Better Corpus (PDF). Austin, Peter K. (編). Language Documentation and Description 2. London: SOAS. 2004: 140–153 [2017-03-14]. (原始內容存檔 (PDF)於2016-03-04). 
  30. ^ British Association for the Advancement of Science. Txt Crimes, Sex Crimes And Murder: The Science Of Forensic Linguistics. ScienceDaily. 2008-09-08 [2010-11-06]. (原始內容存檔於2018-06-14). 
  31. ^ Lee, Ryan. Personal Data Protection in the Semantic Web (PhD thesis). Massachusetts Institute of Technology. 2002 [2010-11-06]. (原始內容存檔於2017-03-14). 
  32. ^ Church, Kenneth; Mercer, Robert. Introduction to the special issue on computational linguistics using large corpora. Computational Linguistics (MIT Press). 1993, 19 (1): 1–24. 
  33. ^ McEnery, Tony; Wilson, Andrew. Corpus Linguistics (PDF). Edinburgh: Edinburgh University Press. 1996 [2017-03-16]. ISBN 0-7486-0808-7. (原始內容存檔 (PDF)於2012-03-07). 
  34. ^ Manning, Christopher; Schütze, Hinrich. Foundations of Statistical Natural Language Processing. Cambridge: MIT Press. 1999. ISBN 0-262-13360-1. 
  35. ^ Rigau, German; Magnini, Bernardo; Agirre, Eneko; Carroll, John. Meaning: A roadmap to knowledge technologies.. Proceedings of COLING Workshop on A Roadmap for Computational Linguistics. Taipei, Taiwan. 2002. 
  36. ^ Volk, Martin. Exploiting the WWW as a corpus to resolve PP attachment ambiguities. Proceedings of Corpus Linguistics 2001. Lancaster, England. 2001. 
  37. ^ Villasenor-Pineda, L.; Montes-y-Gómez, M.; Pérez-Coutino, M.; Vaufreydaz, D. A corpus balancing method for language model construction. Fourth International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2003). Taipei, Taiwan: 393–401. 2003. doi:10.1007/3-540-36456-0_40. 
  38. ^ Hawking, David; Voorhees, Ellen; Craswell, Nick; Bailey, Peter. Overview of the TREC8 Web track. Proceedings of the Eighth Text Retrieval Conference. Gaithersburg, Maryland. 1999. 
  39. ^ Baker, Colin; Fillmore, Charles; Lowe, John. The Berkeley FrameNet Project. Proceedings of COLING-ACL. Montreal: 86–90. 1998. 
  40. ^ Briscoe, Ted; Carroll, John. Automatic extraction of subcategorization from corpora. Proceedings of the fifth Conference on Applied Natural Language Processing. Washington, DC: 356–363. 1997. 
  41. ^ Korhonen, Anna. Using semantically motivated estimates to help subcategorization acquisition. Proceedings of the Joint Conference on Empirical Methods in NLK and Very Large Corpora. Hong Kong: 216–223. 2000. 
  42. ^ Ivković, D. (2013). The Eurovision Song Contest on YouTube: A corpus-based analysis of language attitudes. Language@Internet, 10, article 1. (urn:nbn:de:0009-7-35977)
  43. ^ WORLD INTERNET USAGE AND POPULATION STATISTICS. Internet World Stats. Miniwatts Marketing Group. 2017年3月4日 [2017年3月17日]. (原始內容存檔於2020年2月16日). 
  44. ^ Biber, Douglas. Using register-diversified corpora for general language studies. Computational Linguistics (MIT Press). 1993, 19 (2): 219–242. 
  45. ^ Sekine, Satshi. The domain dependence of parsing. Proceedings of the Fifth Conference on Applied Natural Language Processing. Washington, DC: 96–102. 1997. 
  46. ^ Atkins, Sue; Clear, Jeremy; Ostler, Nicholas. Corpus design criteria. Literary and Linguistic Computing (Oxford Journals). January 1992, 7 (1): 1–16 [2017-03-17]. doi:10.1093/llc/7.1.1. (原始內容存檔於2017-01-23). 
  47. ^ Lester, Mark. Teaching Grammar and Usage. Boston: Allyn and Bacon. 2001. ISBN 0205306551. 
  48. ^ 48.0 48.1 Pawelski, Amanda. Using Internet Slang in Spoken Conversation: LOL! (PDF). Research Paper. United States: Colorado State University. [2010-11-06]. (原始內容 (PDF)存檔於2011-07-07). 
  49. ^ Songz, Trey. LOL :-) Ft. Gucci Mane & Soulja Boy Tell 'Em. Song. Trey Songz. [2010-11-07]. (原始內容存檔於2010-10-10). 
  50. ^ Swanberg, Joe(Director). LOL - The Movie (Movie). America: Swanberg, Joe. 2006 [2010-11-08]. (原始內容存檔於2020-11-09). 
  51. ^ Kaufman, Gil. Miley Cyrus' Movie 'LOL' Picked Up By Distributor. MTV News (MTV). 2010-10-29 [2010-11-08]. (原始內容存檔於2010-12-02). 
  52. ^ Azuelos, Lisa (Director). LOL (Laughing Out Loud) (Movie). France: Azuelos, Lisa. 2008 [2010-11-08]. (原始內容存檔於2012-08-13). 
  53. ^ “厉害了 我的国 我的中国” - 没想到春晚还没开始 中国央视率先来了句流行语. YouTube. WUWU秀. [2017-03-18]. (原始內容存檔於2017-04-06). 
  54. ^ Internet World Stats. Internet Usage Statistics - World Internet Users and Population Stats. Statistics. Miniwatts Marketing Group. 2017-03-04 [2017-03-18]. (原始內容存檔於2020-02-16). 
  55. ^ Ivkovic, D., & Lotherington, H. (2009). Multilingualism in cyberspace: Conceptualising the virtual linguistic landscape. International Journal of Multilingualism, 6(1), 17-36.
  56. ^ 56.0 56.1 Butterfield, Jessica M.; Na, Pan. A Comparison of English and Chinese Internet Language (PDF). Research Paper. [2010-11-11]. (原始內容 (PDF)存檔於2009-03-26). 
  57. ^ Martín, Santiago Jorge Paricio; Cortés, Juan Pablo Martinez. New ways to revitalise minority language: the impact of the Internet in the case of Aragonese. Digithum: the Humanities in the Digital Era (UOC). May 2010, (12) [2010-11-12]. (原始內容存檔於2010-08-15). 
  58. ^ Crystal, David. English as a Global Language. Cambridge: Cambridge University Press. 2003.