誰來為AI解答疫情下人類異常行為數(shù)據(jù)的疑惑

作者:劉俊寰

你還記得,半年前,你打開淘寶,是在看衣服?化妝品?還是準(zhǔn)備換一個手機殼?

疫情打亂了人們的生活計劃,隨著年初疫情逐漸升溫,各大電商平臺的口罩上架后往往秒售罄,有人也因此養(yǎng)成了囤貨的習(xí)慣。

當(dāng)疫情向國外擴散,這個變化也在歐美各國開始出現(xiàn)??偛课挥趥惗氐淖稍児綨ozzle專門為亞馬遜賣家做算法廣告,他們敏銳地注意到了這個變化,疫情之前,手機殼、充電器、樂高在亞馬遜銷售榜上從來沒有跌出過前十,但如今,這些在短短幾天內(nèi)就被擠出榜單,取而代之的是口罩、消毒液等。

他們還繪制了疫情相關(guān)產(chǎn)品的變化曲線圖:

4月12日至18日,亞馬遜網(wǎng)站上的十大搜索詞分別是:衛(wèi)生紙、口罩、口罩、洗手液、紙巾、來蘇爾噴霧劑、科樂士濕巾、口罩、來蘇爾、防菌口罩和N95口罩。

從這些商品內(nèi)容也可以追蹤新冠病毒的傳播軌跡,相關(guān)商品的銷售量在意大利率先達到峰值,其次是西班牙、法國、加拿大和美國,英國和德國緊隨其后。

“短短幾天時間就發(fā)生了如此不可思議的轉(zhuǎn)變。”Nozzle的CEO Rael Cline說道。這種漣漪效應(yīng)在整個零售供應(yīng)鏈中也現(xiàn)出真身,同時,AI也受到了影響,在庫存管理、欺詐檢測、營銷等算法中已經(jīng)出現(xiàn)了造成了“打嗝”(hiccups)現(xiàn)象,也就是說,如今,以正常人類行為為基礎(chǔ)的機器學(xué)習(xí)模型已經(jīng)不能適應(yīng)社會的變化了。

根據(jù)全球AI咨詢公司Pactera Edge,“自動化正在走下坡路”,一些工作人員表示,他們正在謹慎地關(guān)注著那些硬撐著的自動系統(tǒng),以便在需要的時候介入人工修正。

從疫情中,也可以看出,我們的生活與AI交織得多么緊密,但也暴露出了一種微妙的依賴關(guān)系,我們的行為改變會改變AI的工作方式,而AI的工作方式的改變,反過來會再次影響到我們的行為。

“當(dāng)身處這樣與往常不同的環(huán)境時,你永遠不能坐而忘之。”Cline說。

世界變了,數(shù)據(jù)也會變

最開始,機器模型的設(shè)計就是為了應(yīng)對變化,但即使是現(xiàn)在,大多數(shù)模型仍然相當(dāng)脆弱,尤其當(dāng)輸入數(shù)據(jù)與訓(xùn)練過的數(shù)據(jù)差距過大,它們的表現(xiàn)就會很糟糕。Pactera Edge副總裁Rajeev Sharma表示,你以為在建立一個AI系統(tǒng)后就能一走了之?這是錯誤的做法,“AI是一個有生命的、會呼吸的系統(tǒng)”。

根據(jù)Sharma與幾家公司的交流結(jié)果,不少公司因AI無法及時得到修正正在苦苦掙扎。

一家向印度零售商供應(yīng)醬料和調(diào)味品的公司表示,此前公司一直依靠AI的預(yù)測準(zhǔn)備訂購庫存,目前銷售預(yù)測與實際銷售情況存在較大出入。當(dāng)這種情況發(fā)生,自動庫存管理系統(tǒng)就亟需被修復(fù),但“AI從未經(jīng)過這樣極端的訓(xùn)練”。

在新聞領(lǐng)域,也發(fā)生了相關(guān)問題。一家新聞網(wǎng)站使用AI評估文章情感偏向,再根據(jù)結(jié)果提供每日投資建議,但目前新聞比平時都更陰沉,AI給出的建議偏差也較大。

機器模型出現(xiàn)問題很大原因在于,越來越多的企業(yè)雖然購入了相關(guān)系統(tǒng),但缺乏維護系統(tǒng)所需的內(nèi)部知識,而如果想要重新培訓(xùn)一個模型,可能需要專家級的人員重新建設(shè)。

當(dāng)前的危機下,即使是與訓(xùn)練集中的最壞情況相比,現(xiàn)實隨時都有可能變得更糟糕。

在Sharma看來,要訓(xùn)練更多AI,除此之外,訓(xùn)練內(nèi)容應(yīng)該包括過去的“怪胎事件”,比如20世紀30年代經(jīng)濟大蕭條、1987年黑色星期一股市暴跌、2008年金融危機,“這些大災(zāi)變是建立更好的機器學(xué)習(xí)模型的基礎(chǔ)”。

但即便如此,也很難做到萬全準(zhǔn)備。一般來說,如果機器學(xué)習(xí)系統(tǒng)沒有看到它所期望看到的東西,那么就會出現(xiàn)問題。

用AI檢測信用卡詐騙的行為分析公司Featurespace創(chuàng)始人David Excell表示,令人驚訝的是,F(xiàn)eaturespace沒有看到自家AI系統(tǒng)受到太大打擊,在他們看來,人們?nèi)匀幌褚郧澳菢釉趤嗰R遜上買東西、訂閱Netflix,不過,人們不再購買大件商品,也不在新地方消費,這些行為還是足以引起懷疑。

Excell說,公司的工程師們只需要介入調(diào)整,以應(yīng)對購買園藝設(shè)備和電動工具的人激增的情況,這些屬于欺詐檢測算法可能會發(fā)現(xiàn)的那種中間價格異常的購買行為。

“世界變了,數(shù)據(jù)也變了。”Excell說。

AI亟需修正,亞馬遜也逃不出這個命運

倫敦的Phrasee正在動手修改他們的AI系統(tǒng),該公司使用自然語言處理和機器學(xué)習(xí)技術(shù)代表客戶生成電子郵件營銷文案或Facebook廣告,保證文案語氣的正確是工作中相當(dāng)重要的一部分。在工作時,AI能生成大量短語,通過神經(jīng)網(wǎng)絡(luò)運行后挑選出最佳結(jié)果。

但是,鑒于生成的語言可能出錯,在平時,Phrasee也保持讓人類來檢查其輸入和輸出的習(xí)慣。疫情爆發(fā)后,Phrasee意識到,在語言的使用上需要比平時更敏感準(zhǔn)確,于是他們開始著手過濾額外語言,禁止了一些特定的短語如“going viral”,不允許涉及被叫停的活動如“party wear”,甚至刪除了可能會被解讀為高興或驚險的表情符號,以及可能引發(fā)焦慮的詞,如“OMG”“be prepared”“stock up”“brace yourself”等。

然而,作為整個零售行業(yè)的一個小小的分支,很多企業(yè)無法與亞馬遜抗衡,但這也是最微妙的地方。隨著亞馬遜和其250萬第三方賣家努力滿足市場需求,亞馬遜正對其算法進行細微的調(diào)整,以幫助分擔(dān)賣家的負擔(dān)。

畢竟,大多數(shù)亞馬遜上的第三方賣家都是依靠亞馬遜的算法創(chuàng)造收入,賣家將商品存放在亞馬遜倉庫里,亞馬遜負責(zé)所有的物流,包括送貨到家、處理退貨等。交易完成后,亞馬遜會推廣完成訂單的賣家。

例如,你在亞馬遜上搜索Switch后,頂部顯眼的“添加到購物籃”按鈕旁邊的結(jié)果更有可能是使用亞馬遜物流的供應(yīng)商,否則就會被排到更后面的位置。


但在過去幾周里,亞馬遜上這一情況出現(xiàn)了180度扭轉(zhuǎn),為了緩解庫存壓力,亞馬遜的算法現(xiàn)在似乎更傾向于推廣能自己發(fā)貨的賣家。

市場動蕩,人為干預(yù)不可少

如果沒有人工干預(yù),要實現(xiàn)這種調(diào)整是很難的,“情況太不穩(wěn)定了,上周算法工程師還在努力優(yōu)化衛(wèi)生紙,這周大家突然就都想買拼圖或健身器材了”。

亞馬遜對算法進行的調(diào)整隨后影響到在線廣告上的投入,這些算法決定花在廣告上的金額取決于無數(shù)變量,但最終決定是基于用戶對其有多少價值的估計,這其中,有許多方法可以預(yù)測客戶的行為,包括有關(guān)過去購買的數(shù)據(jù),以及廣告公司根據(jù)不同人的在線活動進行的推薦。

但是現(xiàn)在,Cline說,想要預(yù)測點擊廣告的人是否會購買產(chǎn)品,最佳的參考因素之一就是送達時間,這也是Nozzle在和客戶討論調(diào)整算法時提出的意見。例如,如果你認為你不能比競爭對手更快地交付產(chǎn)品,那么想在廣告拍賣中超過他們,所進行的花費可能就是無效的。

這一切只有專業(yè)團隊才能做到。Cline認為,目前的情況讓很多人大開眼界,很多人以為自動化系統(tǒng)都可以自己運行,“但實際上,你需要一個數(shù)據(jù)科學(xué)團隊,從而把社會事件和算法事件聯(lián)系起來。一個算法永遠也不會主動挑選出這些東西”。

現(xiàn)在已經(jīng)步入了萬物相連的時代,從疫情中已經(jīng)可以廣泛地感受到,這也觸動了在更典型的時代仍然隱藏著的機制。如果要尋找一線生機,那么現(xiàn)在正是時候?qū)π卤┞冻鰜淼南到y(tǒng)進行盤點,同時弄清楚如何設(shè)計得更好,使系統(tǒng)更有彈性。

如果要信任機器,我們就需要對它們進行監(jiān)督。

【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘(id: BigDataDigest)”】

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-05-28
誰來為AI解答疫情下人類異常行為數(shù)據(jù)的疑惑
作者:劉俊寰你還記得,半年前,你打開淘寶,是在看衣服?

長按掃碼 閱讀全文