9月7日消息,人工智能公司出門問問在2020年服貿(mào)會上發(fā)布兩款全新魔音系列產(chǎn)品:AI音頻內(nèi)容生產(chǎn)一站式解決方案——“魔音工坊”,AI虛擬主播——“魔影主播”。目前這兩款產(chǎn)品已經(jīng)應(yīng)用于光明日報的音視頻內(nèi)容生產(chǎn)中。
作為一家AI技術(shù)驅(qū)動型公司,出門問問已經(jīng)推出過系列消費級智能硬件產(chǎn)品,包括AI智能手表TicWatch系列、AI真無線智能耳機TicPods系列、智能音箱TicKasa系列等。憑借在消費級場景積累的AI能力和經(jīng)驗,此次出門問問推出兩款A(yù)I音視頻內(nèi)容生產(chǎn)工具,意味著其加速向To B企業(yè)級場景延伸。
出門問問CEO李志飛在接受TechWeb采訪時透露,目前,出門問問公司營收主要來自消費級產(chǎn)品,而且公司海外營收占比超過60%,現(xiàn)在企業(yè)級市場也是公司主要發(fā)力的一塊。
李志飛介紹,盡管受疫情影響,今年前2個季度出門問問的業(yè)績受到一定影響,但是銷售業(yè)績在第三季已經(jīng)出現(xiàn)強勢反彈,預(yù)計全年營收同比去年仍略有增長。
可編輯的AI音視頻生產(chǎn)工具
魔音工坊是一款主打AI音頻生產(chǎn)的產(chǎn)品, 旨在以AI助力音頻內(nèi)容創(chuàng)作,通過獨創(chuàng)的產(chǎn)品和交互,成為AI音頻內(nèi)容生產(chǎn)一站式解決方案,打造AI音頻時代的WORD編輯器。
事實上,市面上已經(jīng)有包括科大訊飛、搜狗等公司推出了類似AI產(chǎn)品,李志飛向TechWeb表示,魔音工坊最大的特色是后臺有一個靈活的編輯工具。
李志飛介紹,盡管AI能力已經(jīng)越來越強,但是不可否認的是目前由AI直接生成的音頻內(nèi)容還是會存在一些誤差,在新聞播報等嚴肅場合是無法直接使用的。魔音工坊通過引入音頻編輯工具,既能實現(xiàn)AI將文字轉(zhuǎn)為音頻的快速性,又能實現(xiàn)人工矯正編輯的準確性,這個價值非常大。
據(jù)介紹,魔音工坊增加的后臺編輯功能,能夠非常個性化的對AI生成的語音內(nèi)容進行定點編輯。利用端到端MeetVoice語音合成引擎,魔音工坊設(shè)計了交互友好的產(chǎn)品形態(tài),用戶可以快速導(dǎo)入要合成聲音的文章,通過類似微軟WORD文檔的編輯操作,即可快速解決拼音、韻律等中文配音問題,讓用戶一站式快捷生產(chǎn)出專業(yè)精品的音頻。
魔音工坊后臺編輯不僅能夠提供定制發(fā)音人、糾正多音字、背景音和音效、多發(fā)音人配音等核心功能,還具備數(shù)字糾錯、變速、韻律糾錯、創(chuàng)建個性“隨身聽”微信小程序等各種便捷有效的工具。
目前魔音工坊已為眾多頭部媒體提供隨身聽小程序,將文字內(nèi)容升級為更有深度和感染力的聲音形態(tài)。提升自媒體用戶體驗,讓粉絲用戶留存、時長和長期忠誠度、活躍度得到更大提升。
此外,出門問問此次發(fā)布的另一款全新產(chǎn)品“AI虛擬主播——魔影主播”,可通過語音驅(qū)動虛擬形象說話及反饋動作。通過將深度學(xué)習(xí)和計算機圖形學(xué)結(jié)合,讓計算機能夠理解語音的內(nèi)容并精細驅(qū)動虛擬形象的口唇動作、面部表情、肢體姿態(tài),生成極具逼真感的虛擬形象動畫。結(jié)合TTS技術(shù),能夠為客戶提供具備豐富表情動作反饋的AI虛擬互動助手。編輯人員僅需輸入文字內(nèi)容,即可快速生成具備同步口型、豐富面部表情及模型動作的AI虛擬主播視頻。
加速布局賦能新聞媒體業(yè)
借助魔音工坊和魔影主播兩款產(chǎn)品,出門問問成功實現(xiàn)AI驅(qū)動的“文字與音頻”、“文字與視頻”之間的快速轉(zhuǎn)換。
出門問問高級技術(shù)總監(jiān)葉順平表示,希望通過這些AI產(chǎn)品幫助傳統(tǒng)媒體更好地適應(yīng)音頻和視頻形態(tài),多渠道分發(fā),讓優(yōu)質(zhì)內(nèi)容觸達到更多用戶,實現(xiàn)內(nèi)容價值最大化,為新聞媒體業(yè)賦能。未來,在AI的加持下,人人皆可玩轉(zhuǎn)多媒體,多種媒體之間也能實現(xiàn)自由融合與轉(zhuǎn)換。
此外,葉順平強調(diào),出門問問深耕語音賽道,擁有完整的“端到端”人機交互相關(guān)技術(shù)棧。在魔影主播與魔音工坊兩款產(chǎn)品背后,是出門問問自主研發(fā)的全CPU低時延端到端語音合成系統(tǒng)MeetVoice (Mobvoi End-to-End TTS Voice) 。其采用基于神經(jīng)網(wǎng)絡(luò)的聲碼器 Meet-Vocoder,可以實現(xiàn)高度接近真人的聲音素質(zhì)。
出門問問使用多發(fā)音人基礎(chǔ)模型,提升語音合成效果,漢字發(fā)音準確率提升至99.6%以上,保持業(yè)界領(lǐng)先水平。在此基礎(chǔ)上,MeetVoice最大限度地提高效率,1秒時間能夠合成近10秒音頻,且無需額外配置GPU。
李志飛表示,目前出門問問可為客戶量身定制全棧式的人工智能解決方案,目前已為物聯(lián)網(wǎng)、金融、電信、餐飲、車載等企業(yè)級場景提供服務(wù)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預(yù)計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。