原標題:無聲的AI:昇騰AI如何用大模型破解手語學(xué)習(xí)的難題?
你是否遇到過這種較為特殊的外賣或快遞,僅能通過短信而無法使用電話提醒送達。此時如果短信被忽略,語言交流的難題就出現(xiàn)了。
“為什么不接電話?”“為什么未經(jīng)我的允許就把快遞放到驛站?”這些對于聽人來說可以輕松解釋溝通的問題,聾人工作者卻因無法聽到客戶電話傳遞的需求,而令雙方產(chǎn)生誤解。
當(dāng)遇到急需辯白或者法律訴訟這種強調(diào)溝通嚴謹性的場合,聾人則更為弱勢。在這些場合聾人如果使用書面表達,不僅效率降低,翻譯得不準確反而會帶來更多波折。有訴訟需求的聾人能否使用手語表達意愿且被準確理解,將直接關(guān)系到他們自身權(quán)益的維護結(jié)果。
據(jù)第二次殘疾人抽樣調(diào)查,目前我國聽力障礙人數(shù)接近3000萬,是國內(nèi)最大的殘障群體。其中,聽力障礙兒童總數(shù)達460多萬人,7歲以下聽障兒達80萬人,每年新增加聽障新生兒2-3萬余名。對于如此龐大的人群,手語是他們打開與世界交流的“窗戶”,但手語的學(xué)習(xí)之路似乎并不那么簡單順暢。
千萬聽力障礙者的溝通障礙
在新聞聯(lián)播中,我們都見過這個場景,電視畫面左下角的手語主持人,她們上下翻飛的熟練手勢快起來和舞蹈一樣美麗。但據(jù)北師大2012年針對接近一萬名聾人開展的跨地區(qū)調(diào)查顯示,只有8%的聾人能看懂很多電視臺的手語新聞,56%的聾人能看懂一些,29%的聾人基本看不懂。
央視主播的普通話,讓南北操持各種方言的人群都能聽得懂,央視的手語主播手勢竟然有一小半的聾人看不懂?這個問題是手語學(xué)習(xí)與教育中長存的挑戰(zhàn)。
1.手語標準不統(tǒng)一。手語有國標手語與自然手語的區(qū)別,與漢語的普通話和方言類似,并且國標手語并不像普通話那樣在全國風(fēng)行,僅出現(xiàn)在新聞、大會翻譯以及學(xué)校教學(xué)中,大多數(shù)聾人群體使用的都是自然手語。而國標手語與自然手語、不同地域之間的自然手語差異也很大,導(dǎo)致聾人與聾人、聾人與聽人之間的溝通并不順暢。
2.師資力量相對缺乏。特殊學(xué)校的手語老師多半是來自特殊教育專業(yè)背景的聽人,對于不斷增長的聾人群體來說,師資力量總體較為緊張。再加上特殊教育學(xué)校的老師打的是國標手語,并不是學(xué)生們自小習(xí)慣的自然手語,因此手語教學(xué)的效率受到一定影響。
3.手語詞匯匱乏。目前,手語詞匯共約有8000個,能滿足日常學(xué)習(xí)、交流,但卻較難涵蓋所有場景。例如一些專業(yè)詞匯“人工智能”或新興詞匯“元宇宙”等,很難使用手語進行充分表達,僅能使用近義詞的形式逐字組合成詞進行傳遞,對聾人來說無法輕松理解組合詞的表意,此外,手語教學(xué)中尚無通用手語語法標準,這也對學(xué)習(xí)、使用手語造成困難。
這些手語溝通中的阻礙與高昂的學(xué)習(xí)成本,讓聾人與外界的交流仿佛隔了一層巨大的透明外殼,外面的人不容易進去,里面的人也很難走出。
如何讓聾人能夠高效學(xué)習(xí)手語、實現(xiàn)順暢溝通、縮短信息交流的“時差”,成為許多科技公司努力的方向。越來越多的企業(yè)也開始借助AI技術(shù)的力量將數(shù)字包容的“種子”撒向這片廣袤的土地。
手語學(xué)習(xí)的智能“靈魂”——昇騰昇思MindSpore AI框架
千博信息基于華為昇騰AI和昇思MindSpore AI框架,利用中科院自動化所的紫東.太初三模態(tài)大模型,打造了手語教考一體機,專門用來幫助有聽力障礙的學(xué)生隨學(xué)、隨練、隨考,助力提升聾人群體的溝通質(zhì)量。
那么昇騰AI和昇思MindSpore AI框架是如何成為手語教考一體機注入的智能“靈魂”呢?
1. 高性能小模型的部署,是支撐教考一體機的核心能力。手語大模型通過知識蒸餾形成可用的高性能小模型,部署在搭載昇騰AI芯片的手語教考一體機上,為其提供核心支撐。
2. 以文生圖與表情及唇語的識別能力,讓理解與翻譯更加精準。基于昇騰AI基礎(chǔ)軟硬件平臺支撐的手語大模型中的表情驅(qū)動及唇語計算,手語虛擬人能夠結(jié)合表情、唇語來表達手語,使其翻譯更加生動精準,實現(xiàn)圖文聯(lián)想。
3.小樣本學(xué)習(xí),提升手語翻譯可懂度。在有限的語料環(huán)境下,手語大模型中的小樣本學(xué)習(xí)能提升手語翻譯的可懂度,讓手語虛擬人的翻譯習(xí)慣更加貼近聾人的認知,目前已初步實現(xiàn)實時的手語詞匯識別能力。
對于聽障學(xué)生來說,他們可以借助設(shè)備學(xué)習(xí)動畫版本的手勢動作、表情、唇語,甚至是更為抽象概念;對于教學(xué)機構(gòu)來說,手語教考一體機能夠?qū)崿F(xiàn)學(xué)習(xí)、考核、出題、綜合評價等自動化教學(xué)過程,減輕老師們的基礎(chǔ)教學(xué)壓力,釋放更多的人文關(guān)懷與創(chuàng)新教育能力。
手語教考一體機可以為聾人以及手語翻譯人群提供國標手語的學(xué)習(xí)、訓(xùn)練、考核能力。不僅讓聾人群體之間順暢交流,更好地享受社會生活與公共服務(wù),同時還能幫助聾人與不懂手語的聽人進行溝通,讓所有人享受數(shù)智生活的便捷。
數(shù)字包容“種子”的無限未來
我們都聽說過這句話:檢驗現(xiàn)代社會的文明程度,從來不是看城市多么繁華,文化多么豐富,而是看這個社會是否關(guān)注、照顧少數(shù)弱勢群體。隨著人工智能的發(fā)展,技術(shù)的“果實”正在普惠整個社會,在數(shù)字包容的公益倡導(dǎo)下,追求人文關(guān)懷與實現(xiàn)社會價值,成為越來越多有擔(dān)當(dāng)企業(yè)的選擇。
基于昇騰AI和昇思MindSpore AI框架的大模型成果,通過大模型的強泛化能力,賦能產(chǎn)業(yè)生態(tài)中的眾多企業(yè),助力應(yīng)用在行業(yè)場景中落地開花。
千博信息推出的手語教考一體機就是產(chǎn)業(yè)大模型落地的典型應(yīng)用之一。除了對特殊群體的關(guān)照外,AI除了在公益領(lǐng)域能夠幫助到障礙人士,在短臨天氣預(yù)測上也能有所作為。短臨天氣預(yù)測與日常生活緊密相連,隨著全球變暖、各類氣象災(zāi)害頻發(fā),及時準確的預(yù)測能有效指導(dǎo)防災(zāi)減災(zāi)工作。華為與高原所、電子科大的合作打造的短臨天氣預(yù)測模型,能夠提升短臨天氣預(yù)測的準確性以減少生命健康和財產(chǎn)損失,這將帶來巨大經(jīng)濟、社會和生態(tài)價值。
在學(xué)術(shù)界,大模型創(chuàng)新層出不窮,但真正走到規(guī)?;a(chǎn)業(yè)部署的寥寥無幾,科研創(chuàng)新和產(chǎn)業(yè)應(yīng)用存在斷點。
華為打通產(chǎn)學(xué)研用,聯(lián)合科研院所、企業(yè)共同建立圍繞大模型的產(chǎn)業(yè)聯(lián)盟平臺,促進產(chǎn)業(yè)內(nèi)各類企業(yè)基于大模型孵化行業(yè)應(yīng)用,讓大模型真正賦能產(chǎn)業(yè),實現(xiàn)產(chǎn)業(yè)聚集,創(chuàng)造更大的價值。
我們可以看到,基于昇騰AI和昇思MindSpore AI框架打造的大模型在產(chǎn)業(yè)落地,不僅賦能傳統(tǒng)行業(yè)提質(zhì)增效,也惠及社會公益領(lǐng)域。文中的兩個案例只是大模型產(chǎn)業(yè)化落地的“冰山一角”,但卻讓我們看到華為踐行數(shù)字包容的不同切片。
讓生活更有溫度,科技從未停止探索的腳步。華為不斷聚集產(chǎn)業(yè)勢能,通過科技改善社會民生,讓技術(shù)與公益的跨界連接越來越緊密。科技力量,正在打破過去人文環(huán)境的“孤島”,讓社會變得更加溫暖。未來,數(shù)字包容的“種子”也會逐漸增多,飄得更遠,隨著這些“種子”蔚然成林,我們離更加幸福的智能生活也會越來越近。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。