日前,由JDD空間站及京東大學(xué)聯(lián)合主辦的“JDD技術(shù)探索日”語音識別專場活動在京舉行,來自京東集團、京東金融、獵戶星空、小米和西北工業(yè)大學(xué)的語音識別技術(shù)專家分享了研究成果。在探索日現(xiàn)場,還舉行了“京東金融對話語音識別大賽”頒獎儀式,獲得冠亞季軍的三位選手分享了參賽心得,并與現(xiàn)場觀眾進行了深入的互動交流。
JDD空間站是由京東金融打造的距離產(chǎn)業(yè)界最近的數(shù)據(jù)探索者社區(qū),包含大賽、社區(qū)和合作伙伴三大板塊,不但為數(shù)據(jù)探索者打造實現(xiàn)自我價值的平臺,同時也為合作伙伴連接優(yōu)秀人才與前沿技術(shù),助力企業(yè)提升數(shù)據(jù)和AI能力,讓科技與商業(yè)應(yīng)用快速融合。
京東金融對話語音識別大賽是JDD空間站上線后的首場比賽,是面向廣大語音技術(shù)愛好者、高校學(xué)生、企業(yè)開發(fā)者而舉辦的語音識別邀請賽。大賽賽題基于京東金融語音識別團隊的實際業(yè)務(wù)場景——客服質(zhì)檢而來。在大賽中,京東金融首次開放了5000小時的京東金融客服語音數(shù)據(jù)(經(jīng)嚴(yán)格脫敏)及GPU資源,希望和大家一同去探索對話語音識別技術(shù)。
在大賽中,來自中國科學(xué)院自動化研究所的白燁,來自小米的莊偉基,來自獵戶星空的宋莎莎三位選手在數(shù)百名參賽選手中脫穎而出,分獲冠亞季軍。
在分享交流環(huán)節(jié),冠軍獲得者白燁無私地分享了參賽過程中的解題思路,并坦言,從初賽的50小時數(shù)據(jù)到?jīng)Q賽時的5000小時數(shù)據(jù),要解決識別方言、口語語法以及排除數(shù)據(jù)噪音等問題,并在短時間內(nèi)創(chuàng)建與訓(xùn)練模型,難度非常之大。但從另一個角度來說,在這樣的壓力下逼迫自己不斷翻閱文獻并調(diào)試完善模型,也是一個對自我極限的挑戰(zhàn)過程,收獲非常之大。他特別感謝了京東金融開放對話語音數(shù)據(jù)的做法,他表示,基于真實應(yīng)用場景的對話語音數(shù)據(jù)在行業(yè)內(nèi)非常珍貴,京東金融開放的5000小時對話語音數(shù)據(jù)對于開發(fā)者甚至對于整個行業(yè)來說,都有非常大的幫助作用。
在分享交流的過程中,亞軍莊偉基、季軍宋莎莎也高度肯定了JDD空間站開放數(shù)據(jù)、開放資源的做法。對此,在交流會后的采訪中,西北工業(yè)大學(xué)計算機學(xué)院音頻、語音與語言處理研究組的謝磊教授也給予了高度評價。
謝磊教授是語音識別領(lǐng)域的知名專家,他認(rèn)為,對話語音識別是語音識別領(lǐng)域難度大且極其具有挑戰(zhàn)性的任務(wù)。對話語音的"即興化"和"口語化"的特點,造成語速快、發(fā)音隨意、吞音少字、講話不符合語法習(xí)慣、語音不流利、說話人語音交疊等現(xiàn)象,再疊加場景的噪聲,給聲學(xué)模型和語言模型的建立帶來了不小的挑戰(zhàn)。京東金融這次開放的語音數(shù)據(jù)是脫敏后的真實客服對話背景,推動了學(xué)術(shù)界對語音識別方面的研究。
謝磊教授還表示,語音識別的入門門檻較高,涉及的知識方方面面,特別是開源數(shù)據(jù)比較缺乏,在一定程度上造成了語音人才的缺乏。京東金融的這次活動是一個很好的橋梁,為連接學(xué)術(shù)界和工業(yè)界的技術(shù)人才和技術(shù)發(fā)展起到了積極作用。
謝磊教授指出,校企合作會實現(xiàn)“三贏”。學(xué)校在一定程度上缺乏數(shù)據(jù)和大算力,也難以獲取業(yè)界豐富的大數(shù)據(jù)資源,和工業(yè)界的合作可以優(yōu)勢互補,利用工業(yè)界的場景大數(shù)據(jù)和大算力,做出"更靠譜"的研究結(jié)果。工業(yè)界可以把一些技術(shù)難題和前瞻性的題目放給學(xué)校去探索,同時通過校企合作吸引學(xué)生合作研究和實習(xí),聯(lián)合培養(yǎng)和儲備人才。學(xué)生則通過接觸工業(yè)界的實際場景和實際問題,獲得"接地氣"的鍛煉,對將來求職和職業(yè)成長都很有幫助。
本次京東金融對話語音識別大賽已經(jīng)畫上圓滿的句號,但JDD空間站才剛剛啟程。京東金融將會依托JDD空間站繼續(xù)推動技術(shù)開放,和更多的合作伙伴去探索推動語音領(lǐng)域技術(shù)發(fā)展的方式;會不斷的發(fā)布更具挑戰(zhàn)性的賽題,也會嘗試開放更多的資源和數(shù)據(jù)。另外,今年的JDD大會及大賽還將如期舉行,旨在為科技界、產(chǎn)業(yè)界、金融界、學(xué)術(shù)界搭建起一個全球化的開放平臺,共同探索數(shù)字科技創(chuàng)新之道,實體經(jīng)濟數(shù)字化升級之路。
- 《GTA 6》或許已經(jīng)可以試玩,但需等待完善,揭示游戲品質(zhì)究竟如何
- ChatGPT新功能:OpenAI推出“深度研究”,復(fù)雜信息查詢與分析成AI新挑戰(zhàn)
- 三星財報不及預(yù)期,2024年Q4營收3774億,前景堪憂
- 華為AR構(gòu)圖引擎引爆駕駛新體驗:駕駛不再單調(diào),科技讓駕駛更有趣!
- 2025年春節(jié)檔戰(zhàn)火紛飛,哪吒歸來破70億,新星崛起成最大贏家
- AI犯罪抬頭,韓國投資巨額研發(fā)新系統(tǒng)應(yīng)對深度偽造威脅
- 微信員工揭秘:微信視頻通話并非人人效果不同,卻有輕度美顏,真實不虛
- DeepSeek沖擊波:英偉達市值一周縮水5520億美元,科技巨頭面臨市場變革?
- 美國華盛頓特區(qū)撞機事故調(diào)查揭新篇章:數(shù)據(jù)揭示真相
- 騰訊云NodeJS SDK打包體積過大引發(fā)熱議,官方致歉并承諾后續(xù)優(yōu)化
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。