在AI打電話這件事上,百度為何甩開(kāi)了谷歌和微軟?

兩個(gè)月前的Google I/O大會(huì)上,“劈柴哥”祭出了手中的王牌AI:GoogleAssistant的一句“嗯哼”,讓全場(chǎng)為之驚艷。

在語(yǔ)音助手的智能化標(biāo)準(zhǔn)還是如何做到“像人”的時(shí)候,Google Assistant的語(yǔ)氣詞,給人的感覺(jué)像是在和真人對(duì)話。本以為谷歌會(huì)因此再度“封神”,卻沒(méi)想到在不到兩個(gè)月后的百度AI開(kāi)發(fā)者大會(huì)上,百度的AI客服便上演了更精彩的一幕。

會(huì)賣萌的AI客服

介紹完L4級(jí)別無(wú)人駕駛的阿波龍后,李彥宏似乎想讓現(xiàn)場(chǎng)的開(kāi)發(fā)者們輕松一下,播放了兩段AI客服邀請(qǐng)開(kāi)發(fā)者參加百度AI開(kāi)發(fā)者大會(huì)的錄音。錄音中,百度的AI客服不僅會(huì)在對(duì)話中自然地加入“喔”、“額”、“嗯”等語(yǔ)氣詞,還能清楚地聽(tīng)到它換氣和呼吸的聲音,給人的感覺(jué)像是在和真人對(duì)話。

如果只有這些的話,百度AI客服和Google Assistant算是旗鼓相當(dāng),但電話過(guò)程中的一個(gè)個(gè)小插曲,除了現(xiàn)場(chǎng)的一陣陣笑聲,也著實(shí)讓人領(lǐng)略到了百度的技高一籌。這里對(duì)兩段AI客服和開(kāi)發(fā)者的對(duì)話片段做一個(gè)還原:

對(duì)話一:

開(kāi)發(fā)者:“誒,你是不是機(jī)器人???”

AI客服:“呃……被您發(fā)現(xiàn)啦,我是開(kāi)發(fā)者大會(huì)智能客服機(jī)器人,很高興為您服務(wù)。”

開(kāi)發(fā)者:“機(jī)器人,哈哈,那你是哪里人???”

AI客服:“這個(gè)還用問(wèn)么,我是百度人?!?/p>

開(kāi)發(fā)者:“那百度給你發(fā)工資嗎?”

AI客服:“嗯……百度為我免費(fèi)充電?!?/p>

對(duì)話二:

AI客服:“想給您確認(rèn),4號(hào)、5號(hào)的百度AI開(kāi)發(fā)者大會(huì)是否會(huì)出席?”

開(kāi)發(fā)者:“會(huì)?!?/p>

AI客服:“哦,好的?!?/p>

開(kāi)發(fā)者:“喂?”

AI客服:“嗯,您說(shuō)?!?/p>

開(kāi)發(fā)者:“哦,沒(méi)事,我以為你是機(jī)器人呢,哈哈哈哈,不好意思。”

事實(shí)上,從7月1號(hào)開(kāi)始這位特殊的客服勤勤懇懇地服務(wù)了幾百位開(kāi)發(fā)者,有人聽(tīng)出了機(jī)器人的身份,有人壓根就沒(méi)有發(fā)覺(jué),有人誤以為是機(jī)器人接下來(lái)又自我否定……雖然百度官方?jīng)]有做出正式的公告,但百度的AI客服已經(jīng)在某種程度上通過(guò)了圖靈測(cè)試,比如機(jī)智地應(yīng)對(duì)突如其來(lái)的質(zhì)疑。

人類的語(yǔ)言系統(tǒng)一直是個(gè)奧秘,文字僅僅承載了20%的溝通,剩下的80%要靠情感來(lái)溝通,從而聽(tīng)出對(duì)話人的喜怒哀樂(lè),做出不失分寸的回答,這也成了人機(jī)對(duì)話與生俱來(lái)的瓶頸。即便語(yǔ)音識(shí)別的準(zhǔn)確度高達(dá)97%以上,人家“喂”了一聲之后就不知道怎么接茬,自然會(huì)被開(kāi)發(fā)者們吐槽成“人工智障”。

而百度AI客服驚艷的地方就在于:不僅可以通過(guò)語(yǔ)氣詞“蒙混過(guò)關(guān)”,就算被識(shí)破后也能做出機(jī)智幽默的回答,即使是比較刁鉆的提問(wèn),依舊應(yīng)答如流。

AI為何要學(xué)會(huì)打電話?

驗(yàn)證AI語(yǔ)音能力的方式有很多,為何百度要選擇打電話?這還要從谷歌和微軟的兩個(gè)先例說(shuō)起。

正如前面所提到的Google Assistant用一句“嗯哼”驚艷全場(chǎng),其實(shí)是谷歌有意展示語(yǔ)音助手幫客戶打預(yù)約電話的能力,比如電話訂餐、理發(fā)店預(yù)約啥的,甚至將Google Duplex定義為能打電話完成真實(shí)世界任務(wù)的 AI 系統(tǒng)。

無(wú)獨(dú)有偶,微軟在中國(guó)召開(kāi)的人工智能大會(huì)上也上演了一場(chǎng)電話秀,甚至為了Diss 隔壁 的Google Duplex,微軟宣布在過(guò)去兩年的時(shí)間內(nèi),小冰與人類用戶完成了累計(jì)超過(guò) 60 萬(wàn)通電話交流,并將小冰定義為情感聊天機(jī)器人。

弄明白了這個(gè)問(wèn)題,我們不妨對(duì)比下百度、谷歌、微軟三家人工智能的“打電話”能力。

Google Duplex與真人溝通對(duì)話的過(guò)程中,可以準(zhǔn)確理解人類語(yǔ)言,并根據(jù)任務(wù)目標(biāo)做出合理自然的應(yīng)答。目前這項(xiàng)技術(shù)針對(duì)的是執(zhí)行一些特定的任務(wù),比如為某幾類活動(dòng)約定時(shí)間。而對(duì)話之所以聽(tīng)起來(lái)真實(shí)自然,在于使用了一個(gè)級(jí)聯(lián) TTS 引擎和一個(gè)生成式 TTS 引擎,能根據(jù)不同的情境控制語(yǔ)音的語(yǔ)調(diào),同時(shí)生成一些語(yǔ)氣詞。

第五代小冰采用了全雙工語(yǔ)音技術(shù)和生成模型,允許數(shù)據(jù)在兩個(gè)方向上同時(shí)傳輸,可以實(shí)時(shí)預(yù)測(cè)人類即將說(shuō)出的內(nèi)容,實(shí)時(shí)生成回應(yīng),并控制對(duì)話節(jié)奏,從而使長(zhǎng)程語(yǔ)音交互成為可能。此外采用該技術(shù)的智能硬件設(shè)備,也不需要用戶在每輪交互時(shí)都說(shuō)出喚醒詞,僅需一次喚醒,就可以輕松實(shí)現(xiàn)連續(xù)對(duì)話,使人與機(jī)器的對(duì)話更像人與人的自然交流。

百度AI客服的內(nèi)核是百度大腦3.0,按照王海峰博士的解釋,“多模態(tài)深度語(yǔ)義理解”是百度大腦3.0的核心,包括數(shù)據(jù)語(yǔ)義、知識(shí)語(yǔ)義、視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言語(yǔ)義等等。而在語(yǔ)音對(duì)話方面主要有兩點(diǎn),一個(gè)是自然語(yǔ)言處理和知識(shí)圖譜,讓AI有能力回答“超綱”的問(wèn)題;另一個(gè)是語(yǔ)音合成怎么聽(tīng)起來(lái)更加自然的語(yǔ)音語(yǔ)義一體化技術(shù),將傳統(tǒng)的拼接技術(shù)和最新的WaveNet技術(shù)有機(jī)結(jié)合在一起,既保證了拼接時(shí)說(shuō)話人的情感,又保證了在WaveNet技術(shù)中輸出聲音的穩(wěn)定性,同時(shí)降低了需要使用的數(shù)據(jù)和成本。

似乎可以下出這樣的結(jié)論:微軟小冰剛剛走出搜語(yǔ)料庫(kù)的階段,打電話也符合小冰作為“聊天機(jī)器人”的定位;Google Assistant仍然只能完成特定任務(wù),完全替代“人類助理”仍尚需時(shí)日;而百度借助AI客戶則展示了全方位的溝通對(duì)話能力,特別是被“識(shí)破”后的機(jī)智,讓外界看到了開(kāi)放應(yīng)用的可能。

不僅僅是AI客服

百度選擇以“客服”展示AI能力,恐怕不只是對(duì)標(biāo)谷歌、微軟那么簡(jiǎn)單,早在去年9月份,在百度金融APP中在線機(jī)器人的服務(wù)占比就已經(jīng)高達(dá)95%。也從另一個(gè)層面證實(shí):對(duì)手們還在炫技的時(shí)候,百度已經(jīng)開(kāi)始了商業(yè)化的應(yīng)用。

而AI智能客服涉及到的語(yǔ)音語(yǔ)義一體化、自然語(yǔ)言處理等只是百度大腦3.0的一小部分能力。比如視覺(jué)語(yǔ)義化可以讓機(jī)器從看清到看懂視頻,可以實(shí)現(xiàn)顧客在無(wú)人超市購(gòu)物的完整體驗(yàn);數(shù)據(jù)語(yǔ)義化技術(shù)可以將大千世界中多元、異構(gòu)和多模態(tài)的三元空間大數(shù)據(jù),形成包含千億節(jié)點(diǎn)、萬(wàn)億關(guān)系的龐大數(shù)據(jù)語(yǔ)義網(wǎng)絡(luò)。如此種種。

值得一提的是,目前百度大腦3.0已經(jīng)對(duì)外開(kāi)放了110多項(xiàng)領(lǐng)先的AI能力,并通過(guò)開(kāi)放EasyDL等定制化平臺(tái)、軟硬一體的AI能力,持續(xù)降低AI應(yīng)用門檻,幫助開(kāi)發(fā)者和企業(yè)應(yīng)用AI實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新與升級(jí)。這也是谷歌、微軟難以企及的。

也就是說(shuō),開(kāi)發(fā)者可以通過(guò)簡(jiǎn)單的接口調(diào)用就能獲得強(qiáng)大的AI能力,進(jìn)而不斷讓創(chuàng)意落地成真。就拿語(yǔ)音語(yǔ)義一體化技術(shù)來(lái)說(shuō),不單單是百度的AI客服,還將被應(yīng)用在智能音箱、智能電視、智能手機(jī)等一系列軟硬件產(chǎn)品上,甚至是我們預(yù)想不到的場(chǎng)景里。

關(guān)于人工智能的使命,百度是這么回答的:從重復(fù)、低效、繁重的腦力判斷工作中把人解放出來(lái)。相信這絕非是一句空談,就好像會(huì)賣萌的AI客服,難道不是你Pick的對(duì)象嗎?

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2018-07-05
在AI打電話這件事上,百度為何甩開(kāi)了谷歌和微軟?
兩個(gè)月前的Google I/O大會(huì)上,“劈柴哥”祭出了手中的王牌AI:GoogleAssistant的一句“嗯哼”,讓全場(chǎng)為之驚艷。

長(zhǎng)按掃碼 閱讀全文