首位跨欄者現(xiàn)身:百度大腦的智能對(duì)話應(yīng)用飛躍

原標(biāo)題:首位跨欄者現(xiàn)身:百度大腦的智能對(duì)話應(yīng)用飛躍

我們對(duì)于AI應(yīng)用的追逐過(guò)程如同跨欄,此時(shí)此刻回頭看看,會(huì)發(fā)現(xiàn)“計(jì)算”、“感知”和“決策”這些橫欄,都已經(jīng)在我們身后。如今我們已經(jīng)可以熟練的用語(yǔ)音識(shí)別和圖像識(shí)別來(lái)感知信息,再通過(guò)機(jī)器學(xué)習(xí)對(duì)海量數(shù)據(jù)的處理來(lái)給出結(jié)論。

如果問(wèn)下一道橫在我們面前有待跨越的橫欄是什么,想必就是意味著“溝通”的智能對(duì)話技術(shù)了。

橫欄在前:智能對(duì)話技術(shù)跨越的前一秒

建立在語(yǔ)音識(shí)別和語(yǔ)音生成等的NLP技術(shù)上,人機(jī)對(duì)話之間的簡(jiǎn)單對(duì)話已經(jīng)非常普及,像是通過(guò)語(yǔ)音喚醒某一項(xiàng)設(shè)備或功能,或是和智能助手進(jìn)行一些單輪問(wèn)詢。但想要系統(tǒng)化地普及智能對(duì)話技術(shù),實(shí)現(xiàn)人機(jī)之間流暢的理解和多輪對(duì)話,恐怕還有著不少限制。而這種限制,已經(jīng)到了亟待跨越的時(shí)候。

第一, 缺乏靈活的自然語(yǔ)言交互對(duì)話,我們?cè)谶M(jìn)行人機(jī)操作時(shí)依然需要依賴按鍵、屏幕等等設(shè)備,對(duì)于AI技術(shù)的應(yīng)用場(chǎng)景有著很多桎梏。

第二, 在無(wú)法進(jìn)行智能對(duì)話的前提之下,很多需要頻繁溝通的工作,依然無(wú)法被AI代勞,即使AI已經(jīng)遠(yuǎn)超人類(lèi)的記憶存儲(chǔ)、計(jì)算決策和感知能力。

舉例來(lái)說(shuō),在車(chē)載、智能音箱、客服和機(jī)器人這四大領(lǐng)域中,智能對(duì)話技術(shù)應(yīng)用的便利與否,就與其體驗(yàn)息息相關(guān)。在車(chē)載場(chǎng)景中,人們無(wú)暇用手與眼與AI進(jìn)行交互,必然要依賴靈活精準(zhǔn)的對(duì)話系統(tǒng)。至于智能音箱這類(lèi)硬件,智能對(duì)話不僅限制其產(chǎn)品形態(tài),也會(huì)影響其服務(wù)能力。智能客服與機(jī)器人更不必說(shuō),對(duì)于這種以交互為主的產(chǎn)品,能否擁有自然的智能對(duì)話技術(shù),實(shí)則是根深立命之本。

從市場(chǎng)表現(xiàn)上,我們也能發(fā)現(xiàn)智能對(duì)話正在進(jìn)入工業(yè)級(jí)應(yīng)用爆發(fā)的潛伏期。

目前來(lái)說(shuō),一項(xiàng)技術(shù)爆發(fā)所需要的四個(gè)因素:技術(shù)高度、生態(tài)廣度、用戶取向和企業(yè)需求,在智能對(duì)話領(lǐng)域已經(jīng)盡數(shù)鋪墊完成。

像自然語(yǔ)言處理、語(yǔ)音技術(shù)以及知識(shí)圖譜等技術(shù)已經(jīng)儲(chǔ)備完善。數(shù)據(jù)顯示,在行業(yè)應(yīng)用中38%的企業(yè)已正在應(yīng)用基于智能對(duì)話的系統(tǒng)、麥克風(fēng)陣列等上下游硬件解決方案,也在智能硬件市場(chǎng)的成長(zhǎng)中達(dá)到一定積累,行業(yè)生態(tài)覆蓋正在加速。數(shù)據(jù)顯示,2019年Q1中國(guó)智能音箱銷(xiāo)量同比增長(zhǎng)9倍,移動(dòng)終端、車(chē)載系統(tǒng)、智能硬件等產(chǎn)品中引入對(duì)話交互的現(xiàn)象也日益普及,毫無(wú)疑問(wèn),用戶無(wú)比渴望更便利的交互方式。最后,在人力成本日益提高時(shí),企業(yè)對(duì)于智能對(duì)話的需求也越來(lái)越旺盛,據(jù)與IDC聯(lián)合調(diào)研,有83.3%企業(yè)認(rèn)為智能對(duì)話能有效降低運(yùn)營(yíng)成本。

在今天,百度舉辦了百度大腦智能對(duì)話引擎及產(chǎn)品發(fā)布會(huì),宣布了百度大腦智能對(duì)話定制平臺(tái)UNIT3.0的全新升級(jí),并展示了智能對(duì)話生態(tài)全景。

就此,我們或許可以確定,人類(lèi)終于向“溝通”這一AI應(yīng)用的橫欄發(fā)起了跨越?jīng)_刺。

復(fù)合型技術(shù)的迷墻

如果將百度大腦看做智能對(duì)話技術(shù)應(yīng)用的第一個(gè)跨越者,我們也可以從中倒推出這項(xiàng)技術(shù)應(yīng)用的難點(diǎn)在哪里。

一般來(lái)說(shuō),某一項(xiàng)技術(shù)工業(yè)級(jí)應(yīng)用的突破要取決于成本效率比、人才儲(chǔ)備、配套服務(wù)和概念認(rèn)知之上。

智能對(duì)話的特殊之處在于,這項(xiàng)技術(shù)的復(fù)合性極強(qiáng),包含了語(yǔ)音識(shí)別、語(yǔ)音生成、語(yǔ)音語(yǔ)義一體化、知識(shí)圖譜構(gòu)建等等一系列技術(shù)。這就意味著這項(xiàng)技術(shù)的成本必然相對(duì)偏高、人才儲(chǔ)備也多半集中在技術(shù)企業(yè)和科技巨頭之中。

而智能對(duì)話技術(shù)所應(yīng)用的場(chǎng)景又相對(duì)復(fù)雜,交互本身無(wú)處不在,智能對(duì)話技術(shù)既可以向智能客服這里軟件服務(wù)領(lǐng)域輸出,又可以投入于智能耳機(jī)、智能音箱這類(lèi)硬件領(lǐng)域。更有很多全新的應(yīng)用空間亟待開(kāi)發(fā)。配套服務(wù)的普及,一定是一條相對(duì)艱難的道路。

綜合下來(lái),會(huì)導(dǎo)致智能對(duì)話技術(shù)距離應(yīng)用場(chǎng)景間隔了一道迷墻,注定了很多企業(yè)對(duì)這項(xiàng)技術(shù)的認(rèn)知理解有所偏差,認(rèn)為這項(xiàng)技術(shù)還并不適合自己的企業(yè)應(yīng)用。

這就是為什么,率先動(dòng)身跨越橫欄的人,會(huì)是百度。

發(fā)起沖刺:UNIT 3.0和語(yǔ)音技術(shù)平臺(tái)正在蓄力

在百度大腦的智能對(duì)話生態(tài)中,為整個(gè)產(chǎn)業(yè)開(kāi)放了兩個(gè)重要產(chǎn)品平臺(tái)。

第一是為開(kāi)發(fā)者提供專(zhuān)業(yè)對(duì)話系統(tǒng)定制技術(shù)的UNIT 3.0。

基于百度多年積累的自然語(yǔ)言處理、知識(shí)圖譜和語(yǔ)音等對(duì)話相關(guān)的AI技術(shù),百度大腦推出的UNIT3.0版本,在搭建技能、構(gòu)建知識(shí)和整合技能與知識(shí)三方面實(shí)現(xiàn)全面升級(jí),其中為開(kāi)發(fā)者提供了很多預(yù)置能力,例如有關(guān)天氣、閑聊、定會(huì)議室的對(duì)話技能,還有大幅提升樣本生產(chǎn)和標(biāo)注效率的DataKit和一系列知識(shí)庫(kù)。

建立在這種模塊化的組件模式上,開(kāi)發(fā)者定制對(duì)話系統(tǒng)就會(huì)變得像拼樂(lè)高一樣簡(jiǎn)單,而非是過(guò)去那樣,在一團(tuán)雜亂的毛線中尋找線頭。如此以來(lái),將極大地降低開(kāi)發(fā)成本和時(shí)間成本,極大地提升效率與性價(jià)比。

第二個(gè)產(chǎn)品平臺(tái),是包含了領(lǐng)域語(yǔ)音方案和語(yǔ)音自訓(xùn)練平臺(tái)的語(yǔ)音技術(shù)平臺(tái)。

相比更傾向于賦能開(kāi)發(fā)者的UNIT 3.0,語(yǔ)音技術(shù)平臺(tái)則進(jìn)一步為企業(yè)客戶提供了更易上手的工具。

在領(lǐng)域語(yǔ)音方案中,我們可以看到百度大腦推出了他們擅長(zhǎng)的端到端一體化解決方案。這次發(fā)布會(huì)中所展示的呼叫中心語(yǔ)音解決方案,就是一個(gè)很好的案例,通過(guò)針對(duì)于呼叫中心場(chǎng)景優(yōu)化過(guò)專(zhuān)屬語(yǔ)音識(shí)別模型,結(jié)合呼叫中心場(chǎng)景專(zhuān)屬8K音庫(kù),可以在識(shí)別和生成兩端進(jìn)行優(yōu)化。對(duì)于那些適用于呼叫中心場(chǎng)景的企業(yè)用戶來(lái)說(shuō),其便利程度接近于即拿即用。

語(yǔ)音自訓(xùn)練平臺(tái),則和EasyDL等自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)類(lèi)似,通過(guò)從基礎(chǔ)語(yǔ)音模型到行業(yè)語(yǔ)音模型再到個(gè)性化語(yǔ)音模型的層層訓(xùn)練,最終提升針對(duì)于場(chǎng)景業(yè)務(wù)的語(yǔ)音識(shí)別率。而這一整個(gè)過(guò)程都是自助式的,不需要代碼基礎(chǔ)。這也自然解決了企業(yè)人才匱乏的致命問(wèn)題。

這兩項(xiàng)產(chǎn)品如同百度大腦智能對(duì)話生態(tài)的左右腿,甩掉了成本、效率和人才的桎梏,直接向智能對(duì)話的工業(yè)級(jí)應(yīng)用發(fā)起沖刺。

客服、消費(fèi)電子與出行:百度大腦的場(chǎng)景飛躍

那么橫欄之后,究竟存在著什么?

一個(gè)人的沖刺是毫無(wú)意義的,既然冠以生態(tài)之名,那么最終目的一定是帶領(lǐng)產(chǎn)業(yè)一同跨欄。

百度大腦智能對(duì)話生態(tài)對(duì)此,已經(jīng)給出了三個(gè)直面落地場(chǎng)景的方案規(guī)劃。如同上文所述,目前在車(chē)載、智能客服、音箱和機(jī)器人幾個(gè)領(lǐng)域中,已經(jīng)涌現(xiàn)出了強(qiáng)烈的智能對(duì)話需求。百度大腦智能生態(tài)給出的落地場(chǎng)景方案,也分別是客服智能對(duì)話場(chǎng)景方案、消費(fèi)電子智能對(duì)話場(chǎng)景方案和出行智能對(duì)話場(chǎng)景方案。在這一系列的場(chǎng)景方案中,百度大腦應(yīng)用了百度技術(shù)生態(tài)中的綜合能力,去解決場(chǎng)景中一貫存在的沉疴。

例如在智能客服領(lǐng)域,智能對(duì)話應(yīng)用的一大難點(diǎn)在于涉及領(lǐng)域過(guò)于廣泛。而百度大腦智能對(duì)話生態(tài)不僅擁有UNIT 3.0和語(yǔ)音技術(shù)平臺(tái)這樣的平臺(tái),同樣也借助了百度智能云ABC深入行業(yè)在各個(gè)領(lǐng)域了累積,就此便可以解決領(lǐng)域的廣泛性問(wèn)題。

在于中國(guó)聯(lián)通軟件研究院的合作中,應(yīng)用了百度AI能力的智慧客服,擁有了更精準(zhǔn)的自然語(yǔ)言識(shí)別率,可以進(jìn)行更隨意的場(chǎng)景切換。截至目前,中國(guó)聯(lián)通智慧客服已經(jīng)將10010的15秒服務(wù)水平提升至88.7%。

在消費(fèi)電子領(lǐng)域,百度大腦能夠給予合作伙伴的不僅是對(duì)于智能對(duì)話技術(shù)的提升,同樣還有一系列配套技術(shù)與服務(wù),讓客戶能夠在同一平臺(tái)之上將智能對(duì)話技術(shù)與其他技術(shù)進(jìn)行排列組合,創(chuàng)造出更多價(jià)值。

就像在教育市場(chǎng)中,圍繞著智能對(duì)話技術(shù)為核心就可以構(gòu)造出全新的物種。一家來(lái)自深圳的教育互動(dòng)類(lèi)硬件廠商“好成績(jī)”,就在發(fā)布會(huì)上展示了應(yīng)用UNIT 3.0打造伴學(xué)機(jī)器人“萌寶”的故事。有了智能對(duì)話技術(shù),教育互動(dòng)類(lèi)硬件可以用更低門(mén)檻的交互方式適合兒童應(yīng)用,也能在不斷對(duì)話中持續(xù)吸引兒童的注意力。更重要的是,“好成績(jī)”表示,百度UNIT 3.0的泛能力強(qiáng),可以瞬間節(jié)約近3個(gè)小時(shí)的數(shù)據(jù)標(biāo)注時(shí)間;配置平臺(tái)上手更快,一個(gè)工程師僅用7-10天,就能夠搭建出對(duì)話機(jī)器人。這對(duì)于一貫追求速度的深圳企業(yè)來(lái)說(shuō),是至關(guān)重要的。

在車(chē)載領(lǐng)域,百度大腦的一項(xiàng)垂直技能是可以克服出行領(lǐng)域信號(hào)不穩(wěn)定的情況,推出了定制化離在線融合框架,在多種網(wǎng)絡(luò)條件下提供同樣的對(duì)話能力。加之借助于百度車(chē)聯(lián)網(wǎng)云端芯行業(yè)解決方案,來(lái)實(shí)現(xiàn)克服車(chē)內(nèi)降噪、連接車(chē)載應(yīng)用等等常見(jiàn)的車(chē)載領(lǐng)域需求。

一個(gè)典型的案例是,在百度AI與和奔馳的合作中,建立在智能對(duì)話能力之上,奔馳的車(chē)載語(yǔ)音系統(tǒng)可以實(shí)現(xiàn)對(duì)車(chē)用說(shuō)明書(shū)的交互化,當(dāng)人們發(fā)現(xiàn)車(chē)內(nèi)的某一個(gè)燈在閃,卻不知道是什么原因時(shí),可以直接以自然語(yǔ)言與車(chē)載OS對(duì)話詢問(wèn),不再需要翻閱厚厚一本說(shuō)明書(shū),也更適合在駕駛過(guò)程中進(jìn)行。

在AI的整體鏈條中,以往人類(lèi)與技術(shù)的接觸需要文字與圖形構(gòu)建的操作界面才能實(shí)現(xiàn)交互,可以說(shuō)是一個(gè)“不智能”的環(huán),連起了智能兩端。而智能對(duì)話技術(shù)的豐滿,也讓中間的環(huán)不斷智能起來(lái),我們與機(jī)器的交互體驗(yàn)將越來(lái)越自然流暢。

不難發(fā)現(xiàn),百度大腦的跨欄優(yōu)勢(shì)并不僅僅在于智能對(duì)話技術(shù)本身,而是憑借自身在AI技術(shù)上的長(zhǎng)期和廣泛投入,在每一環(huán)節(jié)都有著強(qiáng)大的優(yōu)化能力。這也證明了,在智能對(duì)話這一領(lǐng)域中,百度大腦將再一次成為行業(yè)中樞與生態(tài)開(kāi)放引擎。

如此以來(lái),智能對(duì)話技術(shù)所面臨的配套設(shè)施不足問(wèn)題自然迎刃而解。

百度AI:不斷跨欄、不斷自我進(jìn)化

最后,我們可以聊聊智能對(duì)話生態(tài)對(duì)于百度AI的意義。

我們知道,百度是國(guó)內(nèi)最早布局人工智能的企業(yè),百度大腦是百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成者。自百度大腦出現(xiàn)以來(lái),這種開(kāi)放的形式已經(jīng)為這個(gè)平臺(tái)吸引來(lái)了大量合作伙伴。

對(duì)于百度AI自身來(lái)說(shuō),在智能對(duì)話技術(shù)的投入是性價(jià)比極高的。小度系列已經(jīng)在智能音箱領(lǐng)域取得了很好的成績(jī),加上百度搜索引擎的存在,百度自身其實(shí)就是一個(gè)極為頻繁的人機(jī)對(duì)話入口。智能對(duì)話技術(shù)的進(jìn)步,如同在千尺大宅上加蓋房屋,就算只加蓋了一層,擴(kuò)展的卻也是不容小覷的空間。何況百度已經(jīng)通過(guò)小度助手積累了很多擁有語(yǔ)音交互方面需求的合作伙伴,智能對(duì)話引擎的進(jìn)步,將讓百度AI進(jìn)一步提升競(jìng)爭(zhēng)力。

尤其交互溝通是人與AI之間必然出現(xiàn)的環(huán)節(jié),對(duì)于這一環(huán)節(jié)優(yōu)化的普遍需求,或許會(huì)為百度AI帶來(lái)更多全新的生態(tài)伙伴。

其實(shí)對(duì)于百度這樣將AI應(yīng)用生態(tài)作為追逐目標(biāo)的企業(yè)來(lái)說(shuō),對(duì)于每一項(xiàng)技術(shù)應(yīng)用的“跨欄突破”,意義并不在于橫欄本身,而是每進(jìn)一步時(shí),吸引到的生態(tài)伙伴和對(duì)自身技術(shù)生態(tài)的補(bǔ)全。

畢竟終點(diǎn)毫無(wú)意義,在追逐的過(guò)程中,對(duì)于自我的打磨重塑,才是最重要的。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-05-15
首位跨欄者現(xiàn)身:百度大腦的智能對(duì)話應(yīng)用飛躍
綜合下來(lái),會(huì)導(dǎo)致智能對(duì)話技術(shù)距離應(yīng)用場(chǎng)景間隔了一道迷墻,注定了很多企業(yè)對(duì)這項(xiàng)技術(shù)的認(rèn)知理解有所偏差,認(rèn)為這項(xiàng)技術(shù)還并不適合自己的企業(yè)應(yīng)用。

長(zhǎng)按掃碼 閱讀全文