圖靈測試

人工智能测试

圖靈測試(英語:Turing test)是英國電腦科學家艾倫·圖靈於1950年提出的思想實驗,圖靈亦將其稱為「模仿遊戲」(imitation game),這個實驗的流程是由一位詢問者寫下自己的問題,隨後將問題傳送給在另一個房間中的一個人與一台機器,由詢問者根據他們所作的回答來判斷哪一個是真人,哪一個是機器,所有測試者都會被單獨分開,對話以純文字形式透過螢幕傳輸,因此結果不取決於機器的語音能力,這個測試意在探求機器能否模仿出與人類相同或無法區分的智慧型[1]

圖靈測試一個標準的模式:C使用問題來判斷A或B是人類還是機械

圖靈測試是圖靈在他的論文《計算機器與智慧型英語Computing Machinery and Intelligence》中提出的,這篇論文於1950年10月發表於哲學期刊《心靈》中[2],圖靈在這篇論文中探討了「機器能夠思考嗎」這一問題[1],圖靈測試產生了很大的影響力,同時也遭到諸多批評,它亦成為人工智慧哲學中的一個重要概念[3][4][5]

歷史

機器能否思考這個問題歷史悠久,這是二元並存理念唯物論思想之間的區別。笛卡爾在1637年《談談方法》中預言了圖靈測試。

笛卡爾指出,機器能夠與人類互動,但認為這樣的機器不能作出適當的反應,但是任何人都可以。因此,笛卡爾藉此區分機器與人類。笛卡爾沒有考慮到機器語言能力未來能夠被克服。

狄德羅對於圖靈測試的標準:

如果他們發現一隻鸚鵡可以回答一切問題,我會毫不猶豫宣布它存在智慧。
— 狄德羅, Pensées philosophiques, Texte établi par J. Assézat et M. Tourneux, Garnier, I (p. 127-155).[註 1]

這並不意味著他同意這一點,但它已經是唯物主義者當時普遍的說法。

根據二元論者心態,心靈是非物理物質(最起碼具有非物理性),因此不能以純物理來解釋。而根據唯物主義,頭腦可以用物理解釋,這提供了人工智慧產生的可能性。

1936年,哲學家阿爾弗雷德·艾耶爾思考心靈哲學問題:我們怎麼知道其他人曾有同樣的體驗。在《語言,真理與邏輯》中,艾爾建議區別有意識的人類及無意識的機器。

1956年達特茅斯會議之前,英國研究者已經在機器人工智慧研究領域探索了十幾年。比率俱樂部是一個非正式的英國控制論和電子產品研究團體,成員包括艾倫·圖靈

1950年,圖靈發表了一篇劃時代的論文,文中預言了創造出具有真正智慧型的機器的可能性。[6]由於注意到「智慧」這一概念難以確切定義,他提出了著名的圖靈測試:如果一台機器能夠與人類展開對話(透過電傳裝置)而不被辨別出其機器身分,那麼稱這台機器具有智慧。這一簡化使得圖靈能夠令人信服地說明「思考的機器」是可能的。論文中還回答了對這一假說的各種常見質疑。[7]圖靈測試是人工智慧哲學方面首個嚴肅的提案。

2014年6月8日,首次有電腦通過圖靈測試,尤金·古斯特曼成功在雷丁大學所舉辦的測試中騙過研究人員,令他們以為「它」是一個名為尤金·古斯特曼的13歲男孩[8],但後來有文章指出它其實並沒有真正通過測試[9]

2023年7月25日,Nature刊登新聞指出ChatGPT已經能突破圖靈測試,並建議尋求新的人工智慧評估方法[10]

測試內容

如果一個人(代號C)使用測試對象皆理解的語言去詢問兩個他不能看見的對象任意一串問題。對象為:一個是正常思維的人(代號B)、一個是機器(代號A)。如果經過若干詢問以後,C不能得出實質的區別來分辨A與B的不同,則此機器A通過圖靈測試。

完成圖靈測試涉及的技術課題

根據人們的大體判斷,達成能夠通過圖靈測試的技術涉及以下課題[11]

但是為了通過完全圖靈測試,還需要另外兩項額外技術課題:

圖靈測試的變種

許多其他版本的圖靈測試,包括上文所闡述的,已經經過多年的醞釀。

反向圖靈測試和驗證碼

驗證碼(CAPTCHA)是一種反向圖靈測試。在網站上執行一些操作前,使用者被給予一個扭曲的圖形,並要求使用者輸入圖中的字母或數字。這是為了防止網站被自動化系統濫用。理由是能夠精細地閱讀和準確地重現扭曲的形象的系統並不存在(或不提供給普通使用者),所以能夠做到這一點的任何系統可能是個人類。

可以破解驗證碼的軟體正在積極開發,軟體擁有一個有一定準確性的驗證碼分析模式生成引擎。[12]而在破解驗證碼軟體被積極開發的同時,另一種通過反向圖靈測試的準則也被提出來。其認為即使破解驗證碼軟體被成功研發,也只是具有智慧型的人類透過編程對驗證碼所作出的破解手段而已,並非真正通過反向圖靈測試或圖靈測試。而如果一台機器能夠規劃出如同驗證碼一類的防止自動化系統的規避程式,此台機器才算是真正通過了反向圖靈測試。

完全圖靈測試

普通的圖靈測試一般避免審問者與被測試電腦發生物理上的互動,因為物理上類比人(比如像類比人的外表)並不是人工智慧的研究範疇。然而一些人工智慧可能涉及一些人機在物理上的互動,所以人們又拓展出了「完全圖靈測試」。[13]在完全圖靈測試中,可以包含必要的人機在實體層面上的互動。但是為了通過完全圖靈測試,還需要在普通圖靈測試之外另外兩項額外技術課題。詢問者還可以測試受試者的感知能力(需要電腦視覺),和受試者操縱物體的能力(需要機器人學)。[14]

參見

參考文獻

  1. ^ 1.0 1.1 TURING, A. M. I.—COMPUTING MACHINERY AND INTELLIGENCE. Mind. 1950-10-01, LIX (236). ISSN 1460-2113. doi:10.1093/mind/lix.236.433. 
  2. ^ Isaacson, Walter. The Innovators: How a Group of Hackers, Geniuses, and Geeks Created the Digital Revolution. Simon & Schuster. 2014. ISBN 1-4767-0869-X. 
  3. ^ Pinar Saygin, Ayse; Cicekli, Ilyas; Akman, Varol. Turing Test: 50 Years Later. Minds and Machines. 2000-11-01, 10 (4). ISSN 1572-8641. doi:10.1023/A:1011288000451 (英語). 
  4. ^ Artificial Intelligence: A Modern Approach, 4th US ed.. aima.cs.berkeley.edu. [2024-01-07]. (原始內容存檔於2011-02-28). 
  5. ^ Świechowski, Maciej. Game AI Competitions: Motivation for the Imitation Game-Playing Competition. Annals of Computer Science and Information Systems. 2020, 21 [2024-01-07]. ISBN 978-83-955416-7-4. doi:10.15439/2020f126. (原始內容存檔於2024-06-12) (英語). 
  6. ^ McCorduck 2004,第70−72頁, Crevier 1993,第22−25頁, Russell & Norvig 2003,第2−3 and 948頁, Haugeland 1985,第6−9頁, Cordeschi 2002,第170–176頁. See also Turing 1950
  7. ^ Norvig & Russell (2003,第948頁) claim that Turing answered all the major objections to AI that have been offered in the years since the paper appeared.
  8. ^ 存档副本. [2014-06-09]. (原始內容存檔於2014-06-09). 
  9. ^ 存档副本. [2014-06-10]. (原始內容存檔於2014-06-10). 
  10. ^ Biever, Celeste. ChatGPT broke the Turing test — the race is on for new ways to assess AI. Nature. 2023-07-25, 619 (7971) [2023-08-03]. doi:10.1038/d41586-023-02361-7. (原始內容存檔於2023-07-26) (英語). 
  11. ^ Russell, Stuart; Norvig, Peter. Introduction. Artificial Intelligence: A Modern Approach. Upper Saddle River, New Jersey: Pearson Education, Inc. 2010: 2 [2011-01-30]. ISBN 978-0-13-604259-4. 
  12. ^ Malik, Jitendra; Mori, Greg, Breaking a Visual CAPTCHA, [2013-09-22], (原始內容存檔於2019-03-23) 
  13. ^ Oppy, Graham & Dowe, David (2011) The Turing Test頁面存檔備份,存於網際網路檔案館). Stanford Encyclopedia of Philosophy.
  14. ^ Russell & Norvig 2010,第3頁.

註解

  1. ^ 法文:s'il se trouvait un perroquet qui répondît à tout, je prononcerais sans balancer que c'est un être pensant

外部連結