11月4日,在2021騰訊數(shù)字生態(tài)大會(huì)的云智能專場(chǎng)中,騰訊智能產(chǎn)品副總裁、騰訊教育副總裁李學(xué)朝通過題為《溝通有溫度,服務(wù)新高度》的主題演講,正式發(fā)布了騰訊云小微基于新一代多模態(tài)人機(jī)交互技術(shù)的全新數(shù)智人產(chǎn)品矩陣,并對(duì)外分享了數(shù)智人產(chǎn)品的技術(shù)優(yōu)勢(shì)、業(yè)務(wù)場(chǎng)景和應(yīng)用案例。
(騰訊智能產(chǎn)品副總裁、騰訊教育副總裁李學(xué)朝)
“AI助手不僅要提供更加智能的交互體驗(yàn),還需要通過自學(xué)習(xí)和自適應(yīng)等來提升對(duì)于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達(dá)能力。”李學(xué)朝表示,為賦予AI助手交互智能的能力,騰訊云小微整合了語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別等AI能力,融合AI Lab前沿AI技術(shù)以及搜狗數(shù)字人團(tuán)隊(duì)豐富的業(yè)務(wù)模式,打造了基于新一代多模態(tài)人機(jī)交互技術(shù)的全新數(shù)智人產(chǎn)品矩陣,實(shí)現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級(jí)。
談及數(shù)智人的技術(shù)優(yōu)勢(shì)時(shí),李學(xué)朝介紹道,在NLP、知識(shí)圖譜、視覺等全棧AI底層能力的加持下,數(shù)智人擁有強(qiáng)大的形象表現(xiàn)力、識(shí)別力和感知理解能力,能在不同行業(yè)的多種業(yè)務(wù)場(chǎng)景下做到“聽得清、聽得懂、會(huì)表達(dá)”;而3D超寫實(shí)、3D寫實(shí)、3D半寫實(shí)、2D真人、2D卡通五種數(shù)智人的風(fēng)格,搭配可定制形象和騰訊海量IP形象授權(quán),能讓數(shù)智人擁有豐富多樣的人物形象,以滿足不同場(chǎng)景下的服務(wù)需求。
(五款數(shù)智人亮相)
“云小微數(shù)智人應(yīng)用服務(wù)的兩大場(chǎng)景,分別是企業(yè)服務(wù)和生活服務(wù)。”李學(xué)朝表示,目前數(shù)智人已經(jīng)為金融、文教傳媒、公共服務(wù)等行業(yè)的體驗(yàn)型業(yè)務(wù)場(chǎng)景提供解決方案,以坐席客服、審核面簽、理財(cái)顧問等形象為用戶提供智能交互的新體驗(yàn),幫助企業(yè)在提升服務(wù)體驗(yàn)的同時(shí)實(shí)現(xiàn)降本增效的目的。
以金融行業(yè)為例,騰訊云小微數(shù)智人助力平安普惠打造了首個(gè)金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,兩年間已經(jīng)為500萬(wàn)個(gè)用戶提供7x24小時(shí)的自然可視化的人機(jī)智能交互服務(wù),在提升用戶服務(wù)體驗(yàn)的同時(shí),將審核成本降低60%。
“我們希望的是,通過數(shù)智人,在生活服務(wù)中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。”李學(xué)朝表示,未來,騰訊云小微數(shù)智人希望能夠突破時(shí)間和空間的限制,打破虛擬和現(xiàn)實(shí)的邊界,在數(shù)字化進(jìn)程中為各行各業(yè)提供有溫度的智能交互服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。
以下為演講實(shí)錄:
尊敬的各位嘉賓、媒體朋友和線上的觀眾朋友們:
大家好,我是騰訊李學(xué)朝,很高興能在騰訊一年一度的數(shù)字生態(tài)大會(huì)中與大家進(jìn)行交流。
今天主要跟大家分享的是,騰訊云小微數(shù)智人的全新產(chǎn)品,并且從技術(shù)到服務(wù),從內(nèi)到外,從現(xiàn)在到未來,講一講我們“開啟有溫度的數(shù)智未來“的愿景是怎樣展開的。
隨著人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)高速發(fā)展,各行業(yè)數(shù)字化進(jìn)程加快,不同業(yè)務(wù)場(chǎng)景對(duì)線上用戶服務(wù)都提出了更高的要求,AI助手除了要提供更加智能的交互體驗(yàn),還需要通過自學(xué)習(xí)自適應(yīng)等來提升對(duì)于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達(dá)能力。人機(jī)交互模式從文本客服升級(jí)為語(yǔ)音客服再到多模態(tài)人機(jī)交互系統(tǒng),也就是大家常說的數(shù)字人,溝通效率和服務(wù)溫度都得到了大幅提升。
而騰訊云小微通過整合語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別等AI能力,同時(shí)連接騰訊豐富的內(nèi)容和服務(wù)生態(tài),面向使用場(chǎng)景打磨平臺(tái)能力,助力行業(yè)客戶打造有智能、有形象、可交互的數(shù)字分身,實(shí)現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級(jí),也就是騰訊云小微與AI Lab聯(lián)合開發(fā)的新一代多模態(tài)人機(jī)交互系統(tǒng)——數(shù)智人。
最近搜狗正式并入騰訊,也為數(shù)智人能力提供了助力。數(shù)智人產(chǎn)品深度聯(lián)動(dòng)了云小微、AI Lab、搜狗,匯聚云小微綜合AI能力,融合AI Lab前沿AI技術(shù),以及搜狗數(shù)字人團(tuán)隊(duì)豐富的業(yè)務(wù)模式、作為多模態(tài)能力的服務(wù)載體,便捷地服務(wù)于機(jī)構(gòu)、企業(yè),持續(xù)賦能行業(yè)。
這些能力從內(nèi)而外賦予了產(chǎn)品極大的優(yōu)勢(shì)。
首先,通過AI技術(shù)的加持,數(shù)智人產(chǎn)品目前已擁有強(qiáng)大的形象表現(xiàn)力、識(shí)別力和理解能力,并且能夠保證最優(yōu)服務(wù)性能,在很多場(chǎng)景中都能做到“聽得清、聽得懂、會(huì)表達(dá)”。
聽得清就是能夠把人的聲音精準(zhǔn)轉(zhuǎn)化成文本。騰訊云小微在語(yǔ)音識(shí)別方面深耕建模、降噪、口音與領(lǐng)域適應(yīng)等技術(shù)能力,讓數(shù)智人能夠適應(yīng)各種復(fù)雜的噪聲環(huán)境。同時(shí),可識(shí)別超過34種語(yǔ)種、方言,擁有超過46萬(wàn)的垂直場(chǎng)景熱詞庫(kù)。
聽清后還需要聽得懂。騰訊云小微數(shù)智人結(jié)合知識(shí)圖譜能力和垂直領(lǐng)域庫(kù),并充分運(yùn)用全雙工的能力,通過語(yǔ)音(ASR)+語(yǔ)義(NLP)雙向判斷,降低錯(cuò)誤響應(yīng)概率,可進(jìn)行超過11個(gè)語(yǔ)種的機(jī)器翻譯;同時(shí),通過流式語(yǔ)義+語(yǔ)義VAD,在商用環(huán)境中,服務(wù)端推流渲染方案文本驅(qū)動(dòng)首幀延遲已降低至600ms內(nèi),單臺(tái)服務(wù)器并發(fā)上限,半年內(nèi)提升了60%,在保障交互體驗(yàn)的同時(shí),大幅提升了接待的效率。
在表達(dá)交流能力上,騰訊云小微數(shù)智人由個(gè)性化沉浸式TTS、有風(fēng)格的語(yǔ)音合成技術(shù)、以及具備形象、情緒和動(dòng)作的虛擬人合成,擁有超過28種語(yǔ)音合成音色,超過30個(gè)擬人化形象,在技術(shù)內(nèi)測(cè)中實(shí)現(xiàn)了根據(jù)語(yǔ)義匹配肢體動(dòng)作,把對(duì)話內(nèi)容多模態(tài)多層次地表達(dá)出來。
此外,為了讓數(shù)智人有個(gè)性、有情感、更真實(shí)生動(dòng),我們提供了3D超寫實(shí)、3D寫實(shí)、3D半寫實(shí)、2D真人、2D卡通等5類數(shù)智人形象風(fēng)格,擁有超細(xì)微面部情感表情以及數(shù)百種肢體動(dòng)作,可以滿足各類場(chǎng)景需求。同時(shí),擁有騰訊的海量IP形象授權(quán),讓數(shù)智人的形象選擇更加豐富多樣。
每一位數(shù)智人都擁有著不同的形象和性格,可從事不同的職業(yè),并且,每一位都身懷絕技,與眾不同。這兩天,他們也參與到了數(shù)字生態(tài)大會(huì)多個(gè)專場(chǎng)的主持工作中,為所有與會(huì)觀眾帶來了他們的“職業(yè)首秀”。
云小微數(shù)智人一直在通過不斷的自學(xué)習(xí)、自適應(yīng),以求為用戶提供更主動(dòng)、更專業(yè)的服務(wù)。目前,他們已經(jīng)以不同的形象出現(xiàn)在金融、傳媒、文旅、出行等多個(gè)行業(yè)中,踐行著我們服務(wù)于人的理念。接下來讓我們看看,云小微數(shù)智人的落地應(yīng)用情況。
云小微數(shù)智人應(yīng)用服務(wù)的兩大場(chǎng)景,分別是企業(yè)服務(wù)和生活服務(wù)。
在企業(yè)服務(wù)方面,以往一直是以企業(yè)和服務(wù)提供者為中心,現(xiàn)在我們轉(zhuǎn)變?yōu)橐韵M(fèi)者和使用者為中心,通過人機(jī)交互與協(xié)創(chuàng),提升服務(wù)體驗(yàn)的同時(shí)實(shí)現(xiàn)降本增效。在生活服務(wù)方面,數(shù)智人以用戶體驗(yàn)提升為中心,通過實(shí)現(xiàn)“軟硬結(jié)合”,給用戶提供智能交互的新體驗(yàn)。
在企業(yè)服務(wù)場(chǎng)景中,數(shù)智人已優(yōu)先面向金融、文教傳媒、公共服務(wù)等行業(yè)的體驗(yàn)型業(yè)務(wù)場(chǎng)景提供解決方案,可擔(dān)任坐席客服、審核面簽、理財(cái)顧問、資訊播報(bào)、會(huì)展主持、導(dǎo)游導(dǎo)覽等多種角色。
接下來大家可以通過幾個(gè)案例進(jìn)行更深入的了解:
在金融領(lǐng)域,我們助力平安普惠落地了首個(gè)金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,針對(duì)企業(yè)面臨的人工成本攀升、人力缺乏、員工工作時(shí)間無法保障全時(shí)段服務(wù)等痛點(diǎn),通過自然可視化的人機(jī)智能交互,打造金融數(shù)智人分身。目前已累計(jì)服務(wù)用戶500萬(wàn),審核成本降低60%,保障了2年間7x24h的在線服務(wù),極大提升了用戶服務(wù)體驗(yàn)。
在疫情期間,觀眾無法親臨展廳和現(xiàn)場(chǎng),近距離參與各項(xiàng)活動(dòng),給很多展會(huì)活動(dòng)的舉辦帶來了困難。我們?yōu)橹袊?guó)(深圳)國(guó)際文化產(chǎn)業(yè)博覽交易會(huì)打造了線上虛擬講解員,擁有講解服務(wù)能力、多種情緒表達(dá)能力,能夠?qū)φ箯d、展館的相關(guān)問題對(duì)答如流,并配合場(chǎng)景作出生動(dòng)的情緒動(dòng)作反饋,讓用戶在疫情期間,突破空間限制,享受互動(dòng)性極強(qiáng)的在線講解游覽體驗(yàn)。
在新聞播報(bào)領(lǐng)域,我們與新華社合作推出了全球首個(gè)AI合成主播。依托少量音視頻數(shù)據(jù)即可快速、低成本生成主播形象,輸入文本即可AI合成播報(bào)實(shí)時(shí)音視頻流,主播的表情、唇動(dòng)自然且專業(yè),基本與真人無異。到目前為止AI合成主播已經(jīng)累計(jì)播報(bào)新聞超過1萬(wàn)條,保證播報(bào)零誤差,可實(shí)現(xiàn)對(duì)日常和突發(fā)事件的實(shí)時(shí)響應(yīng)。
可以說,數(shù)智人具備降本、增效、提升服務(wù)體驗(yàn)、增強(qiáng)服務(wù)靈活性等優(yōu)勢(shì),比如數(shù)字坐席不但可提供7*24小時(shí)全時(shí)段、大體量服務(wù),成本也僅為真人坐席的1/5,可真正做到多維度提升企業(yè)服務(wù)能力。隨著數(shù)智人技術(shù)的不斷迭代升級(jí),我們相信科技創(chuàng)新的力量也將為企業(yè)服務(wù)創(chuàng)造更大的價(jià)值和可能。
在生活服務(wù)場(chǎng)景,騰訊云小微數(shù)智人也有著很大的應(yīng)用空間。數(shù)智人以交互智能增強(qiáng)人機(jī)互動(dòng),在智能車載、智能交通、智能家居、智能硬件等智能服務(wù)場(chǎng)景,為用戶提供更便捷、智能的服務(wù)。
我們的核心思路是:讓數(shù)智人與智能設(shè)備結(jié)合,打造以用戶為中心的生活服務(wù)。
一方面,數(shù)智人可以助力提升公眾服務(wù)效率。比如,數(shù)智人可及時(shí)、高效地處理用戶在公共交通場(chǎng)景中的票務(wù)等問題,可代替人力進(jìn)行政策問答,提升政策辦事問答效率。同時(shí),憑借語(yǔ)音交互能力優(yōu)勢(shì),加強(qiáng)對(duì)中老年人等群體的服務(wù)關(guān)懷。
另一方面,數(shù)智人可憑借全新的視覺表達(dá),為用戶提供自然、豐富的智能交互服務(wù)。比如在智能家居中,用戶通過語(yǔ)音指令即可隨時(shí)隨地與數(shù)智人交流;個(gè)性化的形象表現(xiàn)和動(dòng)作表達(dá)能力,也能打造出更優(yōu)的虛擬偶像服務(wù)。未來,數(shù)智人技術(shù)將重點(diǎn)向融合文字、聽覺、視覺、觸覺、肢體動(dòng)作等多維度感知的多模態(tài)交互方式演進(jìn)。
我們希望的是,通過數(shù)智人,在生活服務(wù)中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。首先,全天陪伴可隨時(shí)呼喚,提升交互效率;其次,有問題直接問,讓中老年人也可簡(jiǎn)單方便地使用,打破數(shù)字化中的科技鴻溝,高度還原人與人之間的交流,打造有溫度的交流體驗(yàn),拉近個(gè)人與技術(shù)的距離。
同時(shí),數(shù)智人支持個(gè)性化自定義設(shè)置,讓企業(yè)和用戶都可打造屬于自己獨(dú)一無二的數(shù)智人。
前面說的都是我們的過去,我們過往的成就,接下來讓我們說一說未來。未來,我們的數(shù)智人會(huì)向什么方向發(fā)展,又將為社會(huì)創(chuàng)造哪些價(jià)值呢?
正如我今天分享的主題“溝通有溫度,服務(wù)新高度”,未來,騰訊云小微數(shù)智人希望能夠突破時(shí)間和空間的限制,打破虛擬和現(xiàn)實(shí)的邊界,在數(shù)字化進(jìn)程中,為各行各業(yè)提供有溫度的智能交互服務(wù)。
我們將不斷提升平臺(tái)能力,輸出更優(yōu)質(zhì)的AI應(yīng)用解決方案,與更多行業(yè)實(shí)現(xiàn)場(chǎng)景共建,以定制化的服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。同時(shí),在不斷進(jìn)行科技創(chuàng)新、產(chǎn)品創(chuàng)新、模式創(chuàng)新的過程中,更好地服務(wù)社會(huì),服務(wù)于人,為社會(huì)創(chuàng)造更大的價(jià)值,從而全面開啟全新的有溫度的數(shù)智未來!謝謝大家!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )