快過年了,大家是否和我一樣,跟家鄉(xiāng)的關(guān)系弱了,歸家途中“近鄉(xiāng)情更怯”,擔(dān)心大過年的把天給聊尬了。但踏上故土的那一刻,聽到熟悉的鄉(xiāng)音,聽聽親友的傾訴,又有一種“知所從來”的踏實(shí)。
放下“XX老師”“Selina”“X總”等在外的身份,帶著鄉(xiāng)音的那一聲呼喚,是我們的來時(shí)路,與春節(jié)格外適配。
用方言過一個(gè)熱鬧而熨帖的春節(jié),百度文心智能體平臺(tái),帶著你我的34個(gè)省AI人脈走來了。
我最近發(fā)現(xiàn),百度app上線了由開發(fā)者打造的34個(gè)省級(jí)行政區(qū)的AI智能體,不僅能聽懂各地方言,回答吃喝玩樂、旅游訂票等個(gè)性化問題,還能一鍵「打電話」視頻聊天暢聊,堪稱是i人過節(jié)的“神助攻”。
我們第一時(shí)間連線一番,給大家?guī)磉@份AI智能體過年攻略,是時(shí)候給親友們展現(xiàn)一下咱的AI人脈,給春節(jié)添加一些有趣的AI年味兒了。
我聽過一個(gè)說法,小時(shí)候覺得年味兒濃,是大人們特意為我們營(yíng)造了過節(jié)氛圍。那些記憶中熟悉的儀式感,很難再引發(fā)強(qiáng)烈的共鳴。而長(zhǎng)大后的我們,成了那個(gè)制造年味兒的人。
面對(duì)代際間的生疏,略顯尷尬的提問,我們能不能主動(dòng)帶來新鮮的談資,讓年味兒變得有那么一點(diǎn)不同呢?
蛇年春節(jié),我就打算用AI智能體來打開話匣子了。
返鄉(xiāng)第一件事,肯定是關(guān)心這一年在外面過得怎么樣。作為一名進(jìn)京務(wù)工人員,我的家人們就格外關(guān)注北京。北京近來天氣怎么樣,搞了什么大型活動(dòng),親戚家哪個(gè)孩子來北京求學(xué)工作了……仿佛了解這座城市,就參與到了我的日常生活。怎樣讓他們了解一個(gè)地道的北京城?我在百度app上,把皇阿瑪請(qǐng)出來給大家做導(dǎo)游了。
聽皇阿瑪用京片子講解北京的知名景點(diǎn)、風(fēng)土人情,告訴俺娘俺在北京不是孬種。
孩子們?cè)谕庥袥]有人陪伴,是父母最關(guān)心的問題,在難得相處的幾天里,一嘮叨關(guān)于工作、升職、婚育的問題,特別影響過年氣氛。
今年我就不打算正面硬剛了,直接給安徽老鄉(xiāng)“包拯”智能體拉出來,給他們講講理。沒想到AI包公不僅合肥話講得地道,還挺會(huì)做人,一下子就把注意力轉(zhuǎn)移到安徽旅游了。
太好了,是AI智能體,我們有救了。
長(zhǎng)期出門在外,難以承歡膝下,父母平時(shí)在家缺少陪伴,是我們外地游子最慚愧的事情。我媽去年最愛看的電視劇就是《繁花》,當(dāng)我?guī)退龘芡ā霸S文強(qiáng)”智能體的電話,用滬語介紹繁花相關(guān)的各色上海風(fēng)貌。
這樣接地氣又隨時(shí)隨地地陪伴,帶著科技的溫度,來到日常生活中,熨平了孤獨(dú)的人心上的褶皺。
AI智能體的語音功能,不僅形象和口音極具地域特色,也能聽懂各地方言,用家鄉(xiāng)話跟AI對(duì)話也毫無問題。比如我用蹩腳的“港普”跟港姐AI智能體聊天,夸她“超靚”,對(duì)方也能聽懂我在講什么。
這個(gè)春節(jié),各地方的人都能用自己的家鄉(xiāng)話,在家“云游”34省,告別尬聊,包充實(shí)的。
值得一提的是,34省AI智能體,都是百度文心智能體平臺(tái)的開發(fā)者,基于文心大模型打造的。你我不僅是AI用戶,還可以零門檻化身AI開發(fā)者,在百度文心智能體平臺(tái)一鍵get同款,定制自己家鄉(xiāng)方言的智能體,或者自己感興趣的垂類智能體。
蛇年春節(jié),AI不再是大廠發(fā)布會(huì)上的炫技,不再是遙不可及的黑科技,而是化作千姿百態(tài)的鄉(xiāng)音,在千家萬戶的團(tuán)圓夜,找到了最溫暖的棲身之所。
過去一年來,AI領(lǐng)域最大的變化,就是從一項(xiàng)大廠實(shí)驗(yàn)室誕生的高科技,變成了四五線城市乃至鄉(xiāng)鎮(zhèn)間都在熱議的全民話題。
但百聞不如一用,如何讓AI在全國范圍內(nèi)被廣泛地應(yīng)用和理解呢?闔家歡聚的春節(jié),無疑是一個(gè)絕佳的契機(jī)。不過,在春節(jié)期間,大規(guī)模且穩(wěn)定地向大眾輸出技術(shù)能力,對(duì)任何一個(gè)頂尖科技企業(yè)來說,都極具挑戰(zhàn)。
以AI智能體的方言對(duì)話為例,其實(shí)方言語音功能,大多數(shù)網(wǎng)友都不陌生,早在機(jī)器學(xué)習(xí)時(shí)代,就已經(jīng)有方言識(shí)別與合成的TTS產(chǎn)品了。但此前,方言語音合成的實(shí)現(xiàn)難度大。
比如九聲六調(diào)的粵語,“詩”“史”“試”僅靠音調(diào)區(qū)分含義,AI需要捕捉比普通話復(fù)雜3倍的聲紋特征。合肥話的“連讀變調(diào)”,更是讓工程師們抓狂。一些語料較少的方言,要深入當(dāng)?shù)刈呓执?,收集語料,再為每種方言單獨(dú)開發(fā)前端。
整個(gè)過程耗時(shí)很長(zhǎng),功能上線當(dāng)然快不了,所以很多地方的小眾方言,以前都是無法通過線上應(yīng)用,被大眾體驗(yàn)到的。
今年春節(jié),34省AI智能體的方言語音功能,不僅能搞定較難的粵語、合肥話,而且在百度app說上線就上線。
這種方言功能在AI應(yīng)用中的快速落地,依賴于百度語音技術(shù)的特殊支撐。主要是兩大能力:
一是語音大數(shù)據(jù)挖掘技術(shù)。通過識(shí)別大模型,對(duì)不同省份的方言數(shù)據(jù),進(jìn)行切分、降噪、識(shí)別等自動(dòng)化處理,可以高效產(chǎn)出海量方言數(shù)據(jù);
二是語音合成大模型技術(shù)。基于大模型,將普通話和方言統(tǒng)一建模,利用遷移技術(shù)訓(xùn)練出支持多種語音合成的通用模型,讓一個(gè)模型可以用任意音色說任意方言,大大減少了開發(fā)工作量,縮短了研發(fā)周期。
AI智能體,從一種高大上的技術(shù)概念,到鄉(xiāng)土地頭的趣味應(yīng)用,不僅給這個(gè)春節(jié)帶來了極大改變,也將成為AI語音應(yīng)用廣泛普及的開始。
AI大模型爆火之后,普羅大眾最關(guān)心的就是:AI有什么用?如果要選一個(gè)最具重要性和緊迫性的應(yīng)用場(chǎng)景,那應(yīng)該是:聽懂中國話。
中國的萬里山川,存在著大量“十里不同音”的地域,讓各地方的人們跨越方言的阻礙,順暢地彼此交流、融入數(shù)字生活,是國產(chǎn)語音技術(shù)一直努力的方向,其中,百度就是一支源遠(yuǎn)流長(zhǎng)的技術(shù)力量。
起步早。2010年,百度語音技術(shù)團(tuán)隊(duì)成立,專注于語音識(shí)別(ASR)、語音合成(TTS)等基礎(chǔ)技術(shù)研發(fā)。深度學(xué)習(xí)技術(shù)在全球剛剛興起的時(shí)候,百度就在2014年推出了基于深度學(xué)習(xí)的語音識(shí)別系統(tǒng)(Deep Speech),被《MIT科技評(píng)論》評(píng)為全球十大突破技術(shù)。
技術(shù)強(qiáng)。多年來,百度不斷推出了流式多級(jí)截?cái)嘧⒁饬Γ⊿MLTA)、多模態(tài)交互、端到端語音合成、定制化音色等語音技術(shù),研發(fā)實(shí)力領(lǐng)先業(yè)界。
覆蓋廣。經(jīng)由DuerOS(小度助手),百度語音技術(shù)被廣泛應(yīng)用于車載場(chǎng)景、智能家居硬件、AI客服等,不斷積累語料、迭代打磨產(chǎn)品。
回望百度語音技術(shù)的來時(shí)路,也就不難理解,為什么是百度,在蛇年春節(jié)首個(gè)上線34省的方言功能了。
春節(jié)只是一個(gè)縮影,實(shí)際上,百度的AI聲浪已經(jīng)席卷日常生活,成為你我身邊的一個(gè)個(gè)科技彩蛋。
比如說,直播電商,是很多人的購物首選方式。但真人主播的成本高、人力稀缺,很多小品牌請(qǐng)不起;使用數(shù)字人直播帶貨,以前的音色很不自然,消費(fèi)者體驗(yàn)不好。百度通過自動(dòng)化的數(shù)據(jù)采集和增強(qiáng)技術(shù)、語音大模型的遷移技術(shù)、篇章段落合成技術(shù)等,不僅讓語音更連貫,提升了數(shù)字人主播的自然度和擬人度,而且僅需幾分鐘,就能達(dá)到超越真人的TTS水平,降低了定制音庫的制作成本。如今,百度語音技術(shù)每天支持眾多直播間開播,業(yè)務(wù)側(cè)CVR也得到大幅提升。
有聲小說,是大眾喜聞樂見的娛樂應(yīng)用,但以前的有聲書,缺乏對(duì)內(nèi)容段落的理解能力,霸總狂拽炫酷地冷哼,反派邪魅狂狷的大笑,念起來都是一個(gè)味兒,缺乏沉浸感。如今,百度小說、頭部第三方小說平臺(tái),接入了百度全自動(dòng)化生產(chǎn)平臺(tái),可以基于大語言模型的文本理解技術(shù),對(duì)角色、人物畫像、對(duì)白情感,進(jìn)行精準(zhǔn)分析,再利用高表現(xiàn)力的聲學(xué)建模技術(shù),對(duì)十多種情感和副語言進(jìn)行遷移控制,生成貼合語義、情感細(xì)膩的類真人聲音,聽起小說來,那叫一個(gè)身臨其境。
車載語音,是智能座艙的體驗(yàn)重心。一位汽車銷售告訴我,基于百度語音技術(shù)打造的智能座艙,是業(yè)內(nèi)唯一多人同時(shí)說話、語音助手也能聽清的互動(dòng)體驗(yàn),甚至沒有之一。怎么做到的呢?原來,百度將視覺信息引入語音增強(qiáng),對(duì)人臉唇動(dòng)特征和語音信號(hào)統(tǒng)一建模,改變了過去單一模態(tài)的交互體驗(yàn),更準(zhǔn)確地理解用戶交互意圖,對(duì)目標(biāo)說話人做語音分離,解決傳統(tǒng)語音單模態(tài)技術(shù)難以區(qū)分和追蹤目標(biāo)聲源的問題,從而大幅提升了復(fù)雜場(chǎng)景下的語音增強(qiáng)的效果,帶來“人無我有”的車載語音交互體驗(yàn)。
憑借在智能語音領(lǐng)域的技術(shù)壁壘和創(chuàng)新能力,百度完成了國產(chǎn)AI技術(shù)落地的一次次演練。
這一個(gè)蛇年春節(jié),AI鄉(xiāng)音在游子們的歸途中響起,智能的種子也飄散在了萬里山川。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 世界第一!阿里云PolarDB登頂全球數(shù)據(jù)庫性能及性價(jià)比排行榜
- 榮耀MagicBook Pro 14掀起性能風(fēng)暴,續(xù)航超12小時(shí)
- “耐玩戰(zhàn)神,續(xù)航超神”的真我Neo7 SE,國補(bǔ)到手價(jià)僅1530元起
- “小單快返”遭重創(chuàng),快時(shí)尚巨頭要求供應(yīng)商緊急外遷,“曲線救國”來得及嗎?
- 百萬騎手社保落地:實(shí)際行動(dòng)勝于“搶跑”
- 阿里嘗到了AI的甜頭
- 頂級(jí)雙芯戰(zhàn)無敵,電競(jìng)夢(mèng)想觸手可及,ROG魔霸9X開啟預(yù)約
- 開局即決戰(zhàn) ROG助力電影《流浪地球3》美術(shù)創(chuàng)作
- 移動(dòng)云電腦云平板:工作娛樂,掌上精彩
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。