123,123,123

作者：劉鋒

1.關(guān)于機器與人類智慧未來的分歧

2011年2月18日，超級電腦“沃森”打敗了人類，站在了與人類智力競賽的最高領(lǐng)獎臺上。著名的未來學(xué)家?guī)炱濏f爾相信，由于信息技術(shù)正朝著“超人類智能”的奇點邁進(jìn)。當(dāng)這個信息奇點在2045年到來的時候，人工智能將超越人類智慧。

但也有不少科學(xué)家認(rèn)為機器智慧超越人類智慧還只是一個科學(xué)幻想，包括麻省理工的計算機學(xué)教授羅勃?米勒(Rob Miller)，F(xiàn)acebook人工智能實驗室主任、深度學(xué)習(xí)專家Yann LeCun，都認(rèn)為機器算法在一些領(lǐng)域的確超越了人類的能力范圍。但在一些領(lǐng)域，例如對社會和文化的認(rèn)知領(lǐng)域，包括不斷發(fā)明各種新詞匯、傳播小貓的視頻并點贊，或一起參與構(gòu)的其他文化現(xiàn)象。這些是機器算法很難企及的領(lǐng)域。

1950年，圖靈發(fā)表題為《機器能思考嗎？》的論文，第一次提出“機器思維”的概念。提出假想：一個人在不接觸對方的情況下，通過一種特殊的方式，和對方進(jìn)行一系列的問答，如果在相當(dāng)長時間內(nèi)，他無法根據(jù)這些問題判斷對方是人還是計算機，那么，就可以認(rèn)為這個計算機具有同人相當(dāng)?shù)闹橇?，即這臺計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)。

圖靈測試經(jīng)常用來檢驗機器是否具備人的智能，但圖靈測試受人為因素干擾太多，嚴(yán)重依賴裁判者和被測試者的主觀判斷，而且只判斷機器是否具備了人的智能，但機器與人類智慧的差距和變化速度并不能得到定量的分析。因此往往有人宣稱其程序通過圖靈測試，例如2014年6月英國雷丁大學(xué)客座教授凱文?沃維克宣稱一款名為“尤金?古特曼(Eugene Goostman)”的計算機軟件通過了測試，但很快就被人揭發(fā)他們的測試有很大漏洞并由欺詐嫌疑。

那么有沒有一種方法，能夠定量檢測機器智力的發(fā)展水平和速度，并與人類智力進(jìn)行對比，觀察可能潛在的風(fēng)險并進(jìn)行防范。2013年以來我們在機器與互聯(lián)智商方向進(jìn)行了探索，初步成果已經(jīng)發(fā)表在2014年6月6日舉辦的ITQM會議上，下面我們將簡要介紹如何定量分析機器與人類智慧的未來之爭。

2.機器與人類智商通用測試方法（M&H IQ)

在心理科學(xué)中，智力(intelligence)是最難理解的概念之一。目前有關(guān)智力的定義累積起來不下百種，但一個基本共識是，智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力。

對人類智力的測量即智商測試由比奈西蒙最早提出，1905年比奈西蒙發(fā)表了《診斷異常兒童智力的新方法》, 即比納西蒙智力量表，標(biāo)志著智力測驗的正式出現(xiàn)。 1916年，美國斯坦福大學(xué)教授推孟(L.M. Ter man)將比納西蒙量表介紹到美國并予以修訂，修訂之后的量表稱為斯坦福比納量表，它成為目前世界上廣泛流傳的標(biāo)準(zhǔn)測驗之一。

因為目前機器智力發(fā)展還很不完善，不能完全套用對人的智商測試。幾乎沒有任何機器系統(tǒng)能夠完成人類智商測量的操作能力測試，因此我們需要吸收以上智商測試量表的優(yōu)點，設(shè)計新的智力評價體系和建立測試題庫。使之能同時對機器系統(tǒng)和不同年齡階段的人類進(jìn)行測試。這樣得出的結(jié)果將可以定量的看出機器智慧與人類智慧的差距，通過定時測試，也可以發(fā)現(xiàn)機器智慧與人類智慧差距的變化情況。

基于“智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力”這一基本認(rèn)知，可以從知識的獲取能力（觀察能力），知識掌握能力，知識創(chuàng)新能力，知識的反饋能力（表達(dá)能力）等四大方面建立新的機器與人類通用智商評價體系,從這四個方面建立15個分測試，并采用德爾菲法對其賦予權(quán)重。

具有機器智慧的程序有很多種類，其中搜索引擎具有很強的代表性，作為目前互聯(lián)網(wǎng)最重要的應(yīng)用之一，搜索引擎代表有Google，Baidu，Bing等，這些搜索引擎目前在通過各種方式不斷提高搜索引擎的智能水平。

例如從只能識別文字增加到能夠識別聲音和圖片；引入“語義理解”技術(shù)，試圖理解用戶的搜索意圖；通過深度學(xué)習(xí)，讓搜索引擎可以自動識別圖像中是什么物體。因此選擇對搜素引擎進(jìn)行智商測試并與人類進(jìn)行對比將具有典型的意義。

3.世界搜索引擎排名與機器智慧的弱點

根據(jù)機器與人類通用智力量表，可以建立機器與人類通用智商測試題庫（因為篇幅問題，本文不進(jìn)行詳細(xì)介紹），2014年5月我們利用這個測試題庫對全世界50個搜索引擎和3個不同年齡階段的人類群體進(jìn)行測試得到結(jié)果如下：

通過測試我們發(fā)現(xiàn)搜索引擎在知識的掌握能力上遠(yuǎn)遠(yuǎn)超過人類，但在知識的創(chuàng)新能力上全部得分為0。由于知識創(chuàng)新能力在通用智商測試（M&H IQ)的權(quán)重更高，因此世界范圍的搜索引擎的總體智商大大低于人類智慧，最高的Google的智商值也不到人類6歲兒童的一半。

從上述研究還可以看出智能或智力是由不同的因素組成，例如天文，地理，歷史等常識，數(shù)學(xué)計算，語言翻譯。這些方面機器或互聯(lián)網(wǎng)已經(jīng)遠(yuǎn)遠(yuǎn)超過普通人類的能力，甚至強大到令人恐怖的地步，這也是庫茲韋爾的觀點能夠震懾住很多人的主要原因。

但我們往往忽略，除此之外，智力還包括猜測預(yù)測，排列組合，規(guī)律發(fā)現(xiàn)，創(chuàng)新創(chuàng)造，偽裝欺騙等更高等級的智慧因素，而在這些方面，機器和互聯(lián)網(wǎng)表現(xiàn)的基本為0，更不用說與嬰兒比較。

從科技的發(fā)展看，低端的智能，機器的能力突飛猛進(jìn)，高端的智能，機器的能力舉步維艱，數(shù)十年來毫無進(jìn)展，未來的智慧世界應(yīng)該是機器與人類的分工，低端重復(fù)性的智能由機器承擔(dān)，高端的創(chuàng)造性的智能由人類來承擔(dān)。過分的宣揚機器智慧超越人類智慧，正如Facebook人工智能實驗室主任Yann LeCun所說“人工智能的每一個新浪潮，都會帶來這么一段從盲目樂觀到不理智最后到沮喪的階段。未來學(xué)家生來就愿意做出盲目的預(yù)測，尤其是他們特別渴望這個預(yù)測成真的時候，可能是為了實現(xiàn)個人抱負(fù)?！保?br />
最后需要指出，目前建立的機器與人類通用智商測試量表（M&H)還有很大的改進(jìn)空間，但希望這是一個起點，能夠解決圖靈測試的不足和缺陷，為定量分析機器智慧能否超越人類智慧打下初步的基礎(chǔ)。

更多互聯(lián)網(wǎng)前沿科技文章歡迎關(guān)注微信號ITXlab

本文地址:http://quema.com.cn/artinfo/823.html

你知道搜索引擎的智商有多高嗎？

最新收錄