你知道語(yǔ)音助手背后的公司是如何處理你的語(yǔ)音數(shù)據(jù)嗎?

語(yǔ)音助手已經(jīng)成為日常生活中的好幫手,但是你知道不同的公司是如何收集語(yǔ)音數(shù)據(jù)的嗎?

你知道語(yǔ)音助手背后的公司是如何處理你的語(yǔ)音數(shù)據(jù)嗎?

熟悉Alexa、Cortana、Google Assistant、Bixby或Siri嗎?每天都有數(shù)億人使用由亞馬遜、微軟、谷歌、三星或蘋果開(kāi)發(fā)的語(yǔ)音助手,而且使用人數(shù)還在不斷增長(zhǎng)。

據(jù)最近進(jìn)行的一項(xiàng)調(diào)查顯示,每月有9010萬(wàn)美國(guó)成年人在智能手機(jī)上使用語(yǔ)音助手,7700萬(wàn)人在汽車上使用,4570萬(wàn)人在智能揚(yáng)聲器上使用。然而許多用戶可能沒(méi)有意識(shí)到他們的語(yǔ)音記錄不會(huì)被立即刪除。相反,它們可能會(huì)被存儲(chǔ)多年,某些記錄甚至?xí)蓪忛喨藛T進(jìn)行人工分析。

亞馬遜
亞馬遜表示,為了改善客戶體驗(yàn),只對(duì)非常小的語(yǔ)音記錄樣本進(jìn)行分析。例如會(huì)訓(xùn)練語(yǔ)音識(shí)別和自然語(yǔ)言理解系統(tǒng),以便Alexa能更好地理解用戶請(qǐng)求。亞馬遜雇傭了第三方承包商來(lái)審查這些錄音,但亞馬遜表示,公司有嚴(yán)格的技術(shù)和操作保障措施以防止記錄被濫用,而且這些員工無(wú)法直接獲得識(shí)別信息(只有賬號(hào)、名字和設(shè)備序列號(hào))。“所有個(gè)人信息都被高度保密,我們使用多因素認(rèn)證來(lái)限制訪問(wèn)、加密服務(wù)和審計(jì)控制環(huán)境?!?/p>

在web和app設(shè)置頁(yè)面中,亞馬遜為用戶提供了禁用語(yǔ)音錄制功能的選項(xiàng)。不過(guò),該公司表示,在定期審查的過(guò)程中,選擇禁用的用戶的錄音可能還是會(huì)被人工分析。

蘋果
蘋果在其隱私頁(yè)面討論了Siri錄制音頻的審核過(guò)程。蘋果解釋說(shuō),出于更好地開(kāi)發(fā)和保證質(zhì)量,只對(duì)Siri數(shù)據(jù)的一小部分進(jìn)行了“評(píng)分”,并對(duì)其進(jìn)行了標(biāo)注,每個(gè)評(píng)分者都會(huì)根據(jù)音頻質(zhì)量進(jìn)行分類,并指出正確的操作。這些標(biāo)簽有助于持續(xù)提高Siri識(shí)別系統(tǒng)的質(zhì)量。

另外,供審查的錄音都是加密和匿名的,與用戶的姓名或身份等個(gè)人信息無(wú)關(guān)。審閱人員不會(huì)收到用戶設(shè)備的標(biāo)識(shí)符。這些語(yǔ)音記錄會(huì)被保存6個(gè)月,在此期間,Siri的識(shí)別系統(tǒng)會(huì)對(duì)這些錄音進(jìn)行分析,以“更好地理解”用戶的聲音。六個(gè)月后,這些沒(méi)有標(biāo)識(shí)符的錄音也繼續(xù)將被保存下來(lái),用于改進(jìn)和開(kāi)發(fā)Siri,最長(zhǎng)可保存兩年。

谷歌
谷歌的一位發(fā)言人稱,谷歌只進(jìn)行非常有限的音頻轉(zhuǎn)錄,以改進(jìn)語(yǔ)音識(shí)別系統(tǒng),并且應(yīng)用了廣泛的技術(shù)來(lái)保護(hù)用戶個(gè)人信息。谷歌審核的音頻片段與任何可識(shí)別的個(gè)人信息都沒(méi)有關(guān)聯(lián),而且轉(zhuǎn)錄基本上是自動(dòng)的,不由谷歌員工處理。此外,在使用第三方服務(wù)來(lái)審查數(shù)據(jù)的情況下,谷歌通常提供文本,不提供音頻。

谷歌會(huì)無(wú)限期地存儲(chǔ)Google Assistant錄制的音頻片段。但是,谷歌與亞馬遜和蘋果一樣,允許用戶永久刪除這些錄音,并選擇不參與未來(lái)的數(shù)據(jù)收集。盡管如此,谷歌在其隱私政策中表示,可能保留與服務(wù)相關(guān)的信息,以防止垃圾郵件和濫用,并改善服務(wù)。

微軟
微軟的一位代表表示,微軟的支持頁(yè)面中概述了微軟在Cortana方面的隱私做法。微軟收集語(yǔ)音數(shù)據(jù)是為了加強(qiáng)Cortana對(duì)個(gè)人用戶語(yǔ)音模式的理解,不斷改進(jìn)Cortana的識(shí)別和響應(yīng),以及改進(jìn)其他使用語(yǔ)音識(shí)別和理解的產(chǎn)品和服務(wù)。

但是還不清楚是由微軟員工還是第三方承包商進(jìn)行人工審查,以及數(shù)據(jù)是如何匿名的。但該公司表示,只有啟用了“Hey Cortana”功能的電腦,Cortana才會(huì)收集語(yǔ)音。微軟允許用戶通過(guò)訪問(wèn)Windows 10中的控制面板或搜索頁(yè)面來(lái)選擇退出語(yǔ)音識(shí)別。