每日經(jīng)濟(jì)新聞 2018-01-17 08:56:08
阿里巴巴開發(fā)出一個(gè)人工智能(AI)模型,其在斯坦福大學(xué)閱讀理解測試中的得分超出了人類。據(jù)報(bào)道,阿里巴巴上周讓其深度神經(jīng)網(wǎng)絡(luò)模型接受了測試,要求AI給出超過10萬個(gè)問題的確切答案,而這些問題所構(gòu)成的試卷被認(rèn)為是當(dāng)前世界檢測機(jī)器閱讀水平的最權(quán)威標(biāo)準(zhǔn)之一。由阿里巴巴數(shù)據(jù)科學(xué)技術(shù)研究院開發(fā)的這一AI模型在測試中得了82.44分,相比人類對手82.304的得分稍勝一籌。
每經(jīng)編輯 周禹彤
人工智能逐步取代人類的工作,早已不是什么新鮮事了。
不過生而為人,大概內(nèi)心總有點(diǎn)驕傲,覺得在人類的一些保留領(lǐng)域,總不可能被機(jī)器戰(zhàn)勝的,比如語言文學(xué)。人工智能的數(shù)據(jù)庫和算法再厲害,總不能比人類更懂得李白的浪漫和莎翁的幽默吧?
▲圖文無關(guān) 圖片來源:攝圖網(wǎng)
然而每經(jīng)小編注意到,斯坦福大學(xué)問答庫公布的最新測試結(jié)果顯示,阿里巴巴開發(fā)的智能軟件SLQA+和微軟的R-NET+都在一對一較量中戰(zhàn)勝了人類選手。
同時(shí),阿里的SLQA+還在統(tǒng)一標(biāo)準(zhǔn)的總分對比中戰(zhàn)勝了微軟R-NET+,成為這個(gè)問答庫歷史上的最高分。
小時(shí)候曾被語文課的閱讀理解支配過的學(xué)渣們,不知道會(huì)不會(huì)感到恐懼?,F(xiàn)在連機(jī)器人的語文都比你好了!
每日郵報(bào)甚至打出標(biāo)題:在世界上最難的閱讀理解測試中,阿里巴巴的AI破天荒地戰(zhàn)勝人類!
英國金融時(shí)報(bào)指出,隨著人工智能對人類語言理解越來越精準(zhǔn),很多曾被認(rèn)為是專業(yè)人士才能勝任的工作都將逐漸被機(jī)器人取代,例如博物館講解員、客服人員和遠(yuǎn)程服務(wù)的維修技術(shù)人員等。
有的媒體甚至“不懷好意”地提醒道,每年雙11期間,淘寶的客服人員都忙不過來。如今阿里自己擁有了閱讀理解能力超強(qiáng)的AI,要是客戶咨詢“我的包裹怎么還沒到”這類標(biāo)準(zhǔn)問題,未來用機(jī)器人處理客戶提問效率還更高。
每經(jīng)小編注意到,斯坦福大學(xué)問答庫(SQuAD,又稱斯坦福大學(xué)問答理解數(shù)據(jù)集)創(chuàng)立于2016年,被自然語言處理學(xué)界公認(rèn)為業(yè)內(nèi)最重要的數(shù)據(jù)庫。
此數(shù)據(jù)集所有文章都是在全部維基百科頁面隨機(jī)抽取的,數(shù)據(jù)集的量為當(dāng)今其他數(shù)據(jù)集(例如WikiQA)的幾十倍之多。SQuAD一共有大約10.8萬個(gè)問題,以及配套的23215個(gè)科普文章段落,成為測試人工智能閱讀理解水平的一塊重要試金石。
在2018年1月之前,雖然很多人工智能軟件得分都相當(dāng)高,但還沒有戰(zhàn)勝過人類代表的記錄。
每經(jīng)小編注意到,問答庫里的問題設(shè)置都有一定難度,并非簡單地抓取文字就能回答。
比如,某段的一個(gè)問題是,“什么是導(dǎo)致降雨落下的原因”,答案為“重力”。這在文章中需要精確地理解一個(gè)包含幾層意思的從句結(jié)構(gòu)才能正確回答。
1月5日,來自阿阿里巴巴數(shù)據(jù)科學(xué)研究院(iDST)的SLQA+模型最終取得了82.440的答案匹配度,超越了人類的82.304分。而在另一場比賽中,微軟亞洲研究院自然語言計(jì)算組的R-NET+模型同樣戰(zhàn)勝了人類選手。
不過在統(tǒng)一對比的F1標(biāo)準(zhǔn)分(答案部分匹配也能取得一定分?jǐn)?shù))上,阿里的SLQA+戰(zhàn)勝了微軟R-NET+,排名問答庫第一。
每經(jīng)小編注意到,中國企業(yè)騰訊、科大訊飛以及浙江大學(xué)、復(fù)旦大學(xué)和國防科大的人工智能模型也在這個(gè)問答庫的歷史排行榜中穩(wěn)居前列。
自動(dòng)化問答擊敗了人類選手,對我們來說意味著什么?
對于這個(gè)問題,未來主義雜志Futurism認(rèn)為,這意味著在不久的將來,與人面對面打交道的客戶服務(wù)活動(dòng),都可以被AI取代。就連銷售這種傳統(tǒng)上被認(rèn)為需要很強(qiáng)的人際交流能力的職位,也可以被“聽得懂人話”的人工智能取代了。
▲圖文無關(guān) 圖片來源:攝圖網(wǎng)
畢竟今后的AI可以做到精準(zhǔn)理解客戶的訴求,并通過海量的文本數(shù)據(jù)搜尋最合適的答案。
特別是人類將會(huì)邁進(jìn)萬物聯(lián)網(wǎng)的時(shí)代,物聯(lián)網(wǎng)會(huì)讓人工智能客服的的使用范圍更加廣泛。過去當(dāng)你的筆記本電腦出現(xiàn)故障時(shí),你可能在電話這頭費(fèi)勁地描述問題,再根據(jù)工程師的遠(yuǎn)程遙控指示操作修復(fù),這種情景可能會(huì)一去不復(fù)返了。
每經(jīng)小編注意到,作為智能客服的阿里小蜜,就采用了這種機(jī)器學(xué)習(xí)閱讀理解技術(shù)。當(dāng)顧客對某個(gè)商品提出一些基礎(chǔ)性的問題時(shí),機(jī)器可以直接對商品詳情頁面中的信息進(jìn)行閱讀和歸納,來解答用戶的疑問,提高服務(wù)效率。
在雙 11、雙 12 等流量較大的購物節(jié)活動(dòng)中,這樣的自助服務(wù)非常有效果。把這些基礎(chǔ)性的問題交由智能客服去解決,復(fù)雜問題再留給人工客服,可以極大提升工作效率。
除了電商零售行業(yè)之外,機(jī)器語言理解技術(shù)還可以用于博物館解說指南、在線醫(yī)療問題解答等領(lǐng)域中。
英國金融時(shí)報(bào)指出,雙11期間,發(fā)貨受到延遲的買家可能會(huì)蜂擁提問,“我的包裹現(xiàn)在到哪里了”。這種場景其實(shí)和斯坦福問答庫的問題設(shè)置非常類似,阿里的AI完全可以根據(jù)手頭的信息作出判斷和回答。
每經(jīng)小編注意到,在注定將成為下一代“風(fēng)口”的人工智能領(lǐng)域,中國起步較早,目前處于世界領(lǐng)先的地位。
每日電訊報(bào)感嘆說,阿里巴巴從創(chuàng)立到成為世界前十大公司之一,只用了不到20年,“中國速度”實(shí)在驚人。
目前,百度在無人駕駛汽車領(lǐng)域的大力研究初見成效,一些最新成果在拉斯維加斯舉行的“消費(fèi)電子展”(CES)上受到好評(píng);騰訊的微信用戶達(dá)到9億,也在積極投身大數(shù)據(jù)領(lǐng)域研究,而阿里數(shù)據(jù)科學(xué)研究院團(tuán)隊(duì)則剛剛在全世界最嚴(yán)格的閱讀理解測試中取得了歷史性的突破;科大訊飛等中國企業(yè)的技術(shù)實(shí)力,也得到了國外媒體的公認(rèn)好評(píng)。
金融時(shí)報(bào)指出,人口近14億的中國擁有7.3億網(wǎng)民,背靠這個(gè)海量的市場和數(shù)據(jù)集合,加上中國政府的大力支持,中國正在人工智能研究上全面超過美國。這個(gè)1500億美元(約合人民幣9720億元)的大市場,未來將會(huì)由中國人來主宰。
每經(jīng)編輯 鄭直
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP