華爾街見聞 2019-04-11 16:39:25
據(jù)媒體援引亞馬遜員工爆料,該公司智能音箱產(chǎn)品所搭載的Alexa語音識別系統(tǒng)可自動錄制使用者的部分對話,并傳回至公司進行人工識別與注釋,所獲音頻中包含大量用戶無意中泄露的私人信息。
作為掌握著大批用戶信息的科技巨頭,F(xiàn)AANG注定無法擺脫“隱私門”的負面影響,這次被曝光的是Amazon。
據(jù)彭博社報道,七名曾經(jīng)參與過亞馬遜Alexa語音識別系統(tǒng)改進項目的員工透露,這款產(chǎn)品背后的語音識別服務自動錄制了使用者的部分對話,并發(fā)送至亞馬遜設(shè)立在海外多地的工作站,進行人工識別與標記。
Alexa Internet現(xiàn)為亞馬遜旗下的子公司,該公司于2014年開發(fā)了一款智能音箱,取名為Echo,Alexa便是該設(shè)備上所搭載的語音識別系統(tǒng),該產(chǎn)品可通過與用戶之間的語音交互,幫助用戶完成通話、查找資料、點外賣、叫車等多種生活瑣事,仿佛一個無所不能的私人助手。
但本次“隱私門”事件似乎恰恰證明了這款產(chǎn)品并非無所不能——至少它的學習過程還離不開人類的全力輔助。
早在去年,紐約時報就曾揭露過Alexa的重大漏洞,當時,Alexa在一對夫婦的對話中錯誤地識別到喚醒詞和一系列指令,并將兩人的對話內(nèi)容自動發(fā)送給了丈夫的一名雇員。在另一起事件中,Alexa錯誤地識別到用戶的指令,并自顧自地發(fā)出令人毛骨悚然的笑聲。
這是自動語音識別的缺陷所在,也是亞馬遜需要工作人員進行人工輔助的原因。
為了有效識別喚醒指令,Alexa可能任何時候都在工作狀態(tài)中,并用其配備的七個麥克風同時捕捉周圍的一切對話內(nèi)容:
當您想要使用Echo時,只需說出喚醒詞“Alexa”,Echo就會亮起并將音頻流傳輸?shù)皆贫耍肁lexa語音服務即可識別并立即響應您的請求。
另根據(jù)Echo的官方常見問題解答,亞馬遜稱,系統(tǒng)絕不會在沒有得到用戶允許的情況下開始錄音并上傳至云端:
默認情況下,Echo設(shè)備只能檢測您選擇的喚醒詞……除非設(shè)備檢測到喚醒詞(或按下按鈕激活Alexa),否則不會存儲或發(fā)送音頻到云中。
但令人不安的是,本次事件中包括錄音、轉(zhuǎn)錄、識別、反饋在內(nèi)的一系列工作,都是在用戶所不知情的情況下秘密完成的,其內(nèi)容涉及到辦公室對話、家庭聊天、個人私密信息甚至犯罪現(xiàn)場等多個方面。
爆料員工稱,他們所監(jiān)聽到的錄音中,有相當一部分并非在識別到有效喚醒詞后才開始錄制,很多音頻文件以難以識別的各種噪音開始。
七名爆料員工所處的團隊人數(shù)高達數(shù)千人。他們的工作是收聽Alexa傳回的錄音文件,對系統(tǒng)無法自動識別的模糊語音進行人工識別,對存在歧義的指令進行解析并標記,隨后將處理過的內(nèi)容反饋至Alexa系統(tǒng),以幫助系統(tǒng)在未來的工作中更好地完成機器語音識別。
盡管這些員工彼此可以互相交流所監(jiān)聽到的內(nèi)容,但好的方面在于,亞馬遜所收集到的音頻相關(guān)信息中并不包括用戶的真實姓名及地址,僅有Echo設(shè)備序列號等基本信息。
據(jù)彭博社援引亞馬遜發(fā)言人稱:
我們有嚴格的技術(shù)和操作保障措施……員工不能直接訪問作為工作流程一部分的個人或賬戶標識信息,所有信息都別高度保密。
同時,相關(guān)員工透露,該項目系保密項目,由亞馬遜全職員工和外部承包商共同完成,工作地位于波士頓、哥斯達黎加、印度和羅馬尼亞等多個地區(qū),并沒有外部標志顯示出當?shù)貫閬嗰R遜的辦公地點。
由于亞馬遜對音頻文件的使用相當謹慎,本次事件尚未被定性為侵犯用戶隱私,但科技巨頭三番五次地陷入“隱私門”已經(jīng)足夠引起公眾的重視。在去年Facebook“隱私門”事件中,F(xiàn)acebook泄露了超過5000萬名用戶的個人數(shù)據(jù),這些信息被劍橋分析(Cambridge Analytica)用于向用戶推送定制廣告,引發(fā)軒然大波。
去年在國內(nèi),也時常有淘寶、餓了么用戶反饋稱,APP界面的推薦位上出現(xiàn)了他們最近剛剛與他人討論過的產(chǎn)品。在相關(guān)平臺對監(jiān)聽用戶對話予以否認后,手機APP是否可以通過啟用麥克風權(quán)限自動監(jiān)聽成為了一個未解之謎。
AI時代無隱私,在追求計算機比我們自己更加了解自己的過程中,使用者或許不得不犧牲一部分隱私。正如亞馬遜在Echo的描述中所說的那樣:
我們使用您對Alexa的請求來訓練我們的語音識別和自然語言理解系統(tǒng)。我們用來訓練這些系統(tǒng)的數(shù)據(jù)越多,Alexa就能工作得越好,用來自不同客戶的語音記錄來訓練Alexa有助于確保Alexa面對每一個人都能工作得很好。
但這個所謂“機器學習”的過程,事實上有相當一部分來自于幾千名亞馬遜“秘密工作組”員工的人力協(xié)助。
(Echo產(chǎn)品宣傳圖,來源:亞馬遜官網(wǎng))
華爾街見聞 高姝睿
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP