您好,歡迎來到58網(wǎng)站目錄!
當(dāng)前位置:58網(wǎng)站目錄 » 站長資訊 » SEO優(yōu)化技術(shù) » SEO » 文章詳細(xì)

你知道搜索引擎的智商有多高嗎?

站長「蝙蝠俠」:QQ1251270088  瀏覽:1543次 時間:2014-06-19

你知道搜索引擎的智商有多高嗎?
作者:劉鋒

1.關(guān)于機器與人類智慧未來的分歧

2011年2月18日,超級電腦“沃森”打敗了人類,站在了與人類智力競賽的最高領(lǐng)獎臺上。著名的未來學(xué)家?guī)炱濏f爾相信,由于信息技術(shù)正朝著“超人類智能”的奇點邁進(jìn)。當(dāng)這個信息奇點在2045年到來的時候,人工智能將超越人類智慧。

但也有不少科學(xué)家認(rèn)為機器智慧超越人類智慧還只是一個科學(xué)幻想,包括麻省理工的計算機學(xué)教授羅勃?米勒(Rob Miller),F(xiàn)acebook人工智能實驗室主任、深度學(xué)習(xí)專家Yann LeCun,都認(rèn)為機器算法在一些領(lǐng)域的確超越了人類的能力范圍。 但在一些領(lǐng)域,例如對社會和文化的認(rèn)知領(lǐng)域,包括不斷發(fā)明各種新詞匯、傳播小貓的視頻并點贊,或一起參與構(gòu)的其他文化現(xiàn)象。這些是機器算法很難企及的領(lǐng)域。

1950年,圖靈發(fā)表題為《機器能思考嗎?》的論文,第一次提出“機器思維”的概念。提出假想:一個人在不接觸對方的情況下,通過一種特殊的方式,和對方進(jìn)行一系列的問答,如果在相當(dāng)長時間內(nèi),他無法根據(jù)這些問題判斷對方是人還是計算機,那么,就可以認(rèn)為這個計算機具有同人相當(dāng)?shù)闹橇?,即這臺計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)。

圖靈測試經(jīng)常用來檢驗機器是否具備人的智能,但圖靈測試受人為因素干擾太多,嚴(yán)重依賴裁判者和被測試者的主觀判斷,而且只判斷機器是否具備了人的智能,但機器與人類智慧的差距和變化速度并不能得到定量的分析。因此往往有人宣稱其程序通過圖靈測試,例如2014年6月英國雷丁大學(xué)客座教授凱文?沃維克宣稱一款名為“尤金?古特曼(Eugene Goostman)”的計算機軟件通過了測試,但很快就被人揭發(fā)他們的測試有很大漏洞并由欺詐嫌疑。

那么有沒有一種方法,能夠定量檢測機器智力的發(fā)展水平和速度,并與人類智力進(jìn)行對比,觀察可能潛在的風(fēng)險并進(jìn)行防范。2013年以來我們在機器與互聯(lián)智商方向進(jìn)行了探索,初步成果已經(jīng)發(fā)表在2014年6月6日舉辦的ITQM會議上,下面我們將簡要介紹如何定量分析機器與人類智慧的未來之爭。

2.機器與人類智商通用測試方法(M&H IQ)

在心理科學(xué)中,智力(intelligence)是最難理解的概念之一。 目前有關(guān)智力的定義累積起來不下百種, 但一個基本共識是,智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力。

對人類智力的測量即智商測試由比奈西蒙最早提出,1905年比奈西蒙發(fā)表了《診斷異常兒童智力的新方法》, 即比納西蒙智力量表 ,標(biāo)志著智力測驗的正式出現(xiàn)。 1916年,美國斯坦福大學(xué)教授推孟(L.M. Ter man)將比納西蒙量表介紹到美國并予以修訂,修訂之后的量表稱為斯坦福比納量表,它成為目前世界上廣泛流傳的標(biāo)準(zhǔn)測驗之一。

因為目前機器智力發(fā)展還很不完善,不能完全套用對人的智商測試。幾乎沒有任何機器系統(tǒng)能夠完成人類智商測量的操作能力測試,因此我們需要吸收以上智商測試量表的優(yōu)點,設(shè)計新的智力評價體系和建立測試題庫。使之能同時對機器系統(tǒng)和不同年齡階段的人類進(jìn)行測試。這樣得出的結(jié)果將可以定量的看出機器智慧與人類智慧的差距,通過定時測試,也可以發(fā)現(xiàn)機器智慧與人類智慧差距的變化情況。

基于“智力是人們認(rèn)識客觀事物并運用知識解決實際問題的能力”這一基本認(rèn)知,可以從知識的獲取能力(觀察能力),知識掌握能力,知識創(chuàng)新能力,知識的反饋能力(表達(dá)能力)等四大方面建立新的機器與人類通用智商評價體系,從這四個方面建立15個分測試,并采用德爾菲法對其賦予權(quán)重。


具有機器智慧的程序有很多種類,其中搜索引擎具有很強的代表性,作為目前互聯(lián)網(wǎng)最重要的應(yīng)用之一,搜索引擎代表有Google,Baidu,Bing等,這些搜索引擎目前在通過各種方式不斷提高搜索引擎的智能水平。

例如 從只能識別文字增加到能夠識別聲音和圖片;引入“語義理解”技術(shù),試圖理解用戶的搜索意圖;通過深度學(xué)習(xí),讓搜索引擎可以自動識別圖像中是什么物體。因此選擇對搜素引擎進(jìn)行智商測試并與人類進(jìn)行對比將具有典型的意義。

3.世界搜索引擎排名與機器智慧的弱點


根據(jù)機器與人類通用智力量表,可以建立機器與人類通用智商測試題庫(因為篇幅問題,本文不進(jìn)行詳細(xì)介紹),2014年5月我們利用這個測試題庫對全世界50個搜索引擎和3個不同年齡階段的人類群體進(jìn)行測試得到結(jié)果如下:


通過測試我們發(fā)現(xiàn)搜索引擎在知識的掌握能力上遠(yuǎn)遠(yuǎn)超過人類,但在知識的創(chuàng)新能力上全部得分為0。由于知識創(chuàng)新能力在通用智商測試(M&H IQ)的權(quán)重更高,因此世界范圍的搜索引擎的總體智商大大低于人類智慧,最高的Google的智商值也不到人類6歲兒童的一半。

從上述研究還可以看出智能或智力是由不同的因素組成,例如天文,地理,歷史等常識,數(shù)學(xué)計算,語言翻譯。這些方面機器或互聯(lián)網(wǎng)已經(jīng)遠(yuǎn)遠(yuǎn)超過普通人類的能力,甚至強大到令人恐怖的地步,這也是庫茲韋爾的觀點能夠震懾住很多人的主要原因。

但我們往往忽略,除此之外,智力還包括猜測預(yù)測,排列組合,規(guī)律發(fā)現(xiàn),創(chuàng)新創(chuàng)造,偽裝欺騙等更高等級的智慧因素,而在這些方面,機器和互聯(lián)網(wǎng)表現(xiàn)的基本為0,更不用說與嬰兒比較。

從科技的發(fā)展看,低端的智能,機器的能力突飛猛進(jìn),高端的智能,機器的能力舉步維艱,數(shù)十年來毫無進(jìn)展,未來的智慧世界應(yīng)該是機器與人類的分工,低端重復(fù)性的智能由機器承擔(dān),高端的創(chuàng)造性的智能由人類來承擔(dān)。過分的宣揚機器智慧超越人類智慧,正如Facebook人工智能實驗室主任Yann LeCun所說“人工智能的每一個新浪潮,都會帶來這么一段從盲目樂觀到不理智最后到沮喪的階段。未來學(xué)家生來就愿意做出盲目的預(yù)測,尤其是他們特別渴望這個預(yù)測成真的時候,可能是為了實現(xiàn)個人抱負(fù)?!保?br />
最后需要指出,目前建立的機器與人類通用智商測試量表(M&H)還有很大的改進(jìn)空間,但希望這是一個起點,能夠解決圖靈測試的不足和缺陷,為定量分析機器智慧能否超越人類智慧打下初步的基礎(chǔ)。

更多互聯(lián)網(wǎng)前沿科技文章歡迎關(guān)注微信號ITXlab


本文地址:http://quema.com.cn/artinfo/823.html
?