123,123

隨著行業(yè)數(shù)字化、智能化不斷升級(jí)加速，語(yǔ)音交互場(chǎng)景從生活擴(kuò)展到企業(yè)應(yīng)用，從人機(jī)交互擴(kuò)展到人人交互，越來(lái)越多樣化的需求，對(duì)語(yǔ)音交互技術(shù)提出了更高的要求。

11月4日，在2021騰訊數(shù)字生態(tài)大會(huì)云智能專(zhuān)場(chǎng)，騰訊云小微與騰訊AI Lab聯(lián)合發(fā)布了全新技術(shù)品牌——騰訊語(yǔ)音智能，為設(shè)備提供在復(fù)雜語(yǔ)音環(huán)境下，從輸入到輸出交互體驗(yàn)全面升級(jí)的全鏈路的AI+聲學(xué)技術(shù)解決方案。

騰訊語(yǔ)音智能讓語(yǔ)音技術(shù)更好地處理復(fù)雜多變的環(huán)境，為用戶(hù)提供更加自然、智能、擬人化的語(yǔ)音交互體驗(yàn)，為產(chǎn)業(yè)提供更加便捷、低成本、可定制的解決方案。在生活、服務(wù)及生產(chǎn)等場(chǎng)景，在智能家居、車(chē)載語(yǔ)音交互、智能客服、語(yǔ)音質(zhì)檢、口語(yǔ)考試、司法轉(zhuǎn)寫(xiě)、會(huì)議轉(zhuǎn)寫(xiě)等領(lǐng)域都有廣闊的應(yīng)用空間。

　　順應(yīng)場(chǎng)景、需求、設(shè)備升級(jí)趨勢(shì) 全面助力更自然的語(yǔ)音交互體驗(yàn)

本次大會(huì)上，騰訊首次公布了云智能戰(zhàn)略架構(gòu)，面向管理者、生產(chǎn)者、開(kāi)發(fā)者和用戶(hù)四類(lèi)人群，提供決策、協(xié)作、創(chuàng)新和服務(wù)四大核心能力，同時(shí)依托人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的云智能架構(gòu)，貼合客戶(hù)的產(chǎn)業(yè)場(chǎng)景需求，輸出面向各行業(yè)的智能綜合解決方案。騰訊語(yǔ)音智能作為騰訊云智能戰(zhàn)略重要技術(shù)能力支撐，始終堅(jiān)持“服務(wù)于人”的價(jià)值理念，為用戶(hù)帶來(lái)自然的語(yǔ)音交互體驗(yàn)，讓智能交互科技的發(fā)展惠及生活、產(chǎn)業(yè)的方方面面。

從手機(jī)助手、智能家居、車(chē)載交互等滿(mǎn)足大眾需求的應(yīng)用，到智能客服、會(huì)議轉(zhuǎn)寫(xiě)等智能化升級(jí)下的行業(yè)性需求，從人機(jī)交互到遠(yuǎn)程會(huì)議語(yǔ)音降噪、口語(yǔ)翻譯等人人交互場(chǎng)景需求，目前，語(yǔ)音交互的場(chǎng)景和需求在不斷增加。隨著專(zhuān)用芯片的出現(xiàn)和端上計(jì)算能力的不斷增強(qiáng)，運(yùn)行載體擴(kuò)展到了云、端、芯多種形式，搭載語(yǔ)音交互的設(shè)備也變得更為多樣化。

而現(xiàn)有的技術(shù)方案仍有很多問(wèn)題難以解決。比如，在復(fù)雜、嘈雜場(chǎng)景中容易受到環(huán)境噪音的影響，不能有效識(shí)別和分離出目標(biāo)人物語(yǔ)音，還會(huì)受到網(wǎng)絡(luò)情況、麥克風(fēng)等硬件設(shè)備的制約，導(dǎo)致智能終端在與用戶(hù)的交互過(guò)程中，無(wú)法快速準(zhǔn)確地進(jìn)行識(shí)別并做出相應(yīng)的回復(fù)，阻礙人機(jī)交互體驗(yàn)的提升。

騰訊在語(yǔ)音智能領(lǐng)域擁有深厚的能力積累，目前，騰訊語(yǔ)音語(yǔ)義有超過(guò)3400項(xiàng)專(zhuān)利，發(fā)表超過(guò)500篇頂會(huì)論文，累計(jì)服務(wù)3.5億智能終端。騰訊云小微依托其強(qiáng)大的語(yǔ)音智能能力，結(jié)合騰訊AI Lab領(lǐng)先的AI基礎(chǔ)能力，基于對(duì)用戶(hù)場(chǎng)景及需求的深刻洞察，完成了一次技術(shù)迭代與升級(jí)，聯(lián)合打造出了一款能夠提升語(yǔ)音識(shí)別效果和效率的全鏈路AI+聲學(xué)技術(shù)解決方案——騰訊語(yǔ)音智能。

騰訊數(shù)字生態(tài)大會(huì)發(fā)布語(yǔ)音智能全新品牌，升級(jí)語(yǔ)音交互能力

(騰訊杰出科學(xué)家、AI Lab副主任兼智能平臺(tái)部副總經(jīng)理俞棟)

突破業(yè)內(nèi)技術(shù)瓶頸深耕行業(yè)發(fā)展需求全面提升語(yǔ)音智能交互能力

相對(duì)于傳統(tǒng)解決方案，騰訊語(yǔ)音智能在技術(shù)上實(shí)現(xiàn)了突破性升級(jí)。通過(guò)采用一體化的基于全神經(jīng)網(wǎng)絡(luò)的方案，極大提升了在復(fù)雜場(chǎng)景下語(yǔ)音采集、降噪分離和增強(qiáng)的效果，從而為人人通話(huà)或機(jī)器識(shí)別提供了更清晰易懂的語(yǔ)音。通過(guò)使用基于語(yǔ)音語(yǔ)義聯(lián)合優(yōu)化的多領(lǐng)域識(shí)別器，讓機(jī)器對(duì)于各種復(fù)雜語(yǔ)音的識(shí)別率也得到極大提升，可以更好地進(jìn)行轉(zhuǎn)寫(xiě)、理解、和回復(fù)。

另外，騰訊語(yǔ)音智能可以支持多種應(yīng)用場(chǎng)景和設(shè)備，擁有優(yōu)秀的場(chǎng)景適配性和通用性，面向?qū)嶋H場(chǎng)景的定制優(yōu)化更簡(jiǎn)單、高效，在為用戶(hù)提供更加優(yōu)質(zhì)、自然語(yǔ)音交互體驗(yàn)的同時(shí)，也為企業(yè)場(chǎng)景中的語(yǔ)音服務(wù)需求降低了運(yùn)行和定制成本，助力其降本增效，加快產(chǎn)業(yè)數(shù)字化升級(jí)。

在戶(hù)外、酒會(huì)等高噪聲、嘈雜的環(huán)境中使用手機(jī)助手、智能客服等語(yǔ)音服務(wù)時(shí)，環(huán)境的噪聲會(huì)對(duì)目標(biāo)人物語(yǔ)音的收集帶來(lái)極大干擾，語(yǔ)音收集反饋的錯(cuò)誤率也會(huì)隨之提升。騰訊語(yǔ)音智能在前端技術(shù)上，通過(guò)研發(fā)全神經(jīng)網(wǎng)絡(luò)波束成型方案、構(gòu)建集合全鏈路的神經(jīng)網(wǎng)絡(luò)模型方案、首創(chuàng)用三種模態(tài)進(jìn)行語(yǔ)音分離的工作模式，完成了行業(yè)內(nèi)的多項(xiàng)技術(shù)突破，可有效應(yīng)對(duì)環(huán)境噪聲干擾人聲的問(wèn)題，實(shí)現(xiàn)了場(chǎng)景深度定制，多模塊自動(dòng)聯(lián)合優(yōu)化，在復(fù)雜聲學(xué)環(huán)境中大幅度降低了語(yǔ)音收集的錯(cuò)誤率。數(shù)據(jù)表示，經(jīng)過(guò)多模態(tài)語(yǔ)音分離再進(jìn)行語(yǔ)音識(shí)別，錯(cuò)誤率可降低相對(duì)50%，經(jīng)過(guò)多模態(tài)分離并聯(lián)合進(jìn)行多模態(tài)的語(yǔ)音識(shí)別，錯(cuò)誤率可進(jìn)一步降低相對(duì)25%。

騰訊數(shù)字生態(tài)大會(huì)發(fā)布語(yǔ)音智能全新品牌，升級(jí)語(yǔ)音交互能力

(騰訊AI Lab語(yǔ)音技術(shù)中心總監(jiān) 蘇丹)

在家居和車(chē)載等真實(shí)場(chǎng)景下，除了需要克服環(huán)境噪聲、人聲干擾等問(wèn)題外，還需要應(yīng)對(duì)多種挑戰(zhàn)，諸如識(shí)別任務(wù)復(fù)雜度高，用戶(hù)口音多變、用戶(hù)更自然的語(yǔ)音交互體驗(yàn)需求，以及低資源設(shè)備上識(shí)別性能的提升等。深入問(wèn)題探索，騰訊語(yǔ)音智能在后端處理環(huán)節(jié)研發(fā)了“語(yǔ)音-語(yǔ)義結(jié)合的多領(lǐng)域在線(xiàn)識(shí)別系統(tǒng)”、“全雙工交互及閑聊拒識(shí)”、“端到端高性能離線(xiàn)識(shí)別系統(tǒng)”等技術(shù)方案，運(yùn)用深度學(xué)習(xí)建模、前后端聯(lián)合優(yōu)化、語(yǔ)音-語(yǔ)義聯(lián)合優(yōu)化等技術(shù)手段，很好地滿(mǎn)足了不同應(yīng)用場(chǎng)景下,對(duì)于語(yǔ)音交互在識(shí)別率、魯棒性、資源消耗和用戶(hù)體驗(yàn)等多方面的要求。

目前，騰訊語(yǔ)音智能已經(jīng)為索尼電視、飛利浦電視提供技術(shù)支持，為家居場(chǎng)景中的人機(jī)互動(dòng)提供更智能的語(yǔ)音體驗(yàn);在車(chē)載交互領(lǐng)域，助力長(zhǎng)安汽車(chē)、福特汽車(chē)等，提升語(yǔ)音助手服務(wù)質(zhì)量，給用戶(hù)更好的智能出行服務(wù)。

騰訊數(shù)字生態(tài)大會(huì)發(fā)布語(yǔ)音智能全新品牌，升級(jí)語(yǔ)音交互能力

(騰訊智能產(chǎn)品高級(jí)專(zhuān)家馬龍)

未來(lái)，隨著行業(yè)和場(chǎng)景需求的迭代升級(jí)和智能終端的快速發(fā)展，智能語(yǔ)音的應(yīng)用將擁有越來(lái)越大的發(fā)展空間。騰訊語(yǔ)音智能將持續(xù)專(zhuān)注語(yǔ)音智能技術(shù)，發(fā)展連續(xù)對(duì)話(huà)、多模態(tài)交互等能力，為用戶(hù)構(gòu)建更具個(gè)性化、更自然、更有情感的語(yǔ)音交互體驗(yàn)，以“交互智能”為大眾帶來(lái)更加智能化的生活方式。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）

騰訊數(shù)字生態(tài)大會(huì)發(fā)布語(yǔ)音智能全新品牌，升級(jí)語(yǔ)音交互能力

騰訊數(shù)字生態(tài)大會(huì)發(fā)布語(yǔ)音智能全新品牌，升級(jí)語(yǔ)音交互能力