一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

概述

人工智能 (AI) 技術(shù)的廣泛應(yīng)用深度改變了教育的形態(tài),催生了蓬勃發(fā)展的智慧教育。得益于數(shù)據(jù)的不斷積累、算力的不斷突破、以及算法的持續(xù)創(chuàng)新,基于AI的計(jì)算機(jī)視覺、語音交互、自然語言理解等應(yīng)用在教育行業(yè)得到了快速發(fā)展,能夠通過深入挖掘端到端的海量教育數(shù)據(jù)價(jià)值,為教學(xué)工作提供出色支持,從而顯著降低教師的教學(xué)負(fù)擔(dān),提升教學(xué)的精準(zhǔn)性、有效性、針對(duì)性。

一起教育科技近年來持續(xù)強(qiáng)化“AI+教育”的融合,并在旗下的免費(fèi)學(xué)習(xí)工具“一起作業(yè)”中推出了應(yīng)用 AI 技術(shù)、可以對(duì)學(xué)生英語口語水平進(jìn)行準(zhǔn)確測(cè)評(píng)的一起作業(yè) AI 口語測(cè)評(píng)平臺(tái),致力于為老師們提供更加精準(zhǔn)的分?jǐn)?shù)評(píng)判體系,為學(xué)生們提供更加有效的學(xué)情反饋。為提升基礎(chǔ)設(shè)施平臺(tái)對(duì)于海量業(yè)務(wù)的支撐能力,為師生提供更高效的智能口語測(cè)評(píng)服務(wù),一起教育科技使用第二代英特爾 至強(qiáng) 可擴(kuò)展處理器搭建了 AI 服務(wù)器,顯著提升了性能表現(xiàn),不僅能夠支撐億級(jí)日均調(diào)用量的需求,而且在總體擁有成本 (TCO) 方面具備出色優(yōu)勢(shì)。

背景:AI 技術(shù)助力降低口語學(xué)習(xí)門檻,提升學(xué)習(xí)效果

在英語學(xué)習(xí)過程中,口語是非常重要的一部分,為提升英語口語水平,全國諸多地區(qū)在中考英語中增加口語測(cè)試,各個(gè)學(xué)校作為英語教學(xué)的主體,廣泛強(qiáng)化了英語口語學(xué)習(xí),并通過口語教學(xué)、口語測(cè)評(píng)、口語糾正等方式來提升學(xué)生的口語能力。在傳統(tǒng)口語學(xué)習(xí)場(chǎng)景中,要評(píng)判口語水平,往往需要師生以“一對(duì)一”的方式來進(jìn)行,教師有限的時(shí)間和精力與學(xué)生大量的口語評(píng)判需求之間形成了尖銳的矛盾,學(xué)校需要能夠智能、準(zhǔn)確地測(cè)評(píng)學(xué)生口語的平臺(tái),以滿足口語學(xué)習(xí)的旺盛需求。

在此背景下,利用 AI 技術(shù)的口語測(cè)評(píng)平臺(tái)應(yīng)運(yùn)而生。此類平臺(tái)能夠利用計(jì)算機(jī)輔助語言學(xué)習(xí)(Computer Assisted Language Learning)等技術(shù),將用戶口語發(fā)音所形成的音頻數(shù)據(jù)進(jìn)行特征提取,并輸入到聲學(xué)模型。隨后,平臺(tái)會(huì)將聲學(xué)模型與語言模型進(jìn)行融合計(jì)算,最終對(duì)于用戶的發(fā)音進(jìn)行評(píng)分。其評(píng)測(cè)維度包括發(fā)音準(zhǔn)確度、流暢度、自然度、完整度等,能夠幫助學(xué)生智能檢測(cè)口語學(xué)習(xí)成果。

一起教育科技AI Lab負(fù)責(zé)人饒豐指出:“AI 口語測(cè)評(píng)平臺(tái)的重要意義不僅在于其能夠提供一套高效、智能化、隨取隨用的口語評(píng)測(cè)能力,顯著降低學(xué)校與老師的教學(xué)負(fù)擔(dān),還有利于彌補(bǔ)區(qū)域之間的教育質(zhì)量鴻溝,推動(dòng)教育公平。由于經(jīng)濟(jì)發(fā)達(dá)區(qū)域與落后區(qū)域在口語教學(xué)資源方面存在巨大差異,導(dǎo)致大量三四線城市以及鄉(xiāng)村的中小學(xué)生難以獲得高質(zhì)量的口語教育,口語評(píng)測(cè)的質(zhì)量難以保證,而 AI 口語測(cè)評(píng)與在線教育的結(jié)合,能夠通過標(biāo)準(zhǔn)化、普適化的服務(wù),讓偏遠(yuǎn)地區(qū)的學(xué)生也能夠享受到優(yōu)秀的教育資源。”

基于在 AI 等技術(shù)方面的長期積累與創(chuàng)新,一起教育科技推出了搭載智能引擎的一起作業(yè) AI 口語測(cè)評(píng)平臺(tái),該平臺(tái)在評(píng)測(cè)準(zhǔn)確性、評(píng)測(cè)效率等方面都實(shí)現(xiàn)了突破,能夠真實(shí)地反映出學(xué)生當(dāng)前口語的真實(shí)水平,并給出糾錯(cuò)建議。目前,一起作業(yè)AI 口語測(cè)評(píng)平臺(tái)已經(jīng)累計(jì)了千萬級(jí)用戶,日均服務(wù)調(diào)用量達(dá)到億級(jí)。

一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

圖1. 一起作業(yè) AI 口語測(cè)評(píng)平臺(tái)

如此巨大的服務(wù)規(guī)模給后端基礎(chǔ)設(shè)施帶來了沉重的壓力。由于中小學(xué)口語教育的特殊性,每天的 19:00-21:00 是學(xué)生在線進(jìn)行口語學(xué)習(xí)與測(cè)評(píng)的高峰期,服務(wù)瞬時(shí)并發(fā)量極高,一旦后端的 AI 基礎(chǔ)設(shè)施平臺(tái)無法承載如此巨大的服務(wù)并發(fā)量,可能導(dǎo)致服務(wù)速度變慢。此外,用戶對(duì)于 AI 口語測(cè)評(píng)的性能正在提出越來越高的要求,高實(shí)時(shí)性與低延遲正在成為用戶體驗(yàn)的重要組成部分,一起教育科技希望能夠降低口語測(cè)評(píng)系統(tǒng)的實(shí)時(shí)率(RTF, Real Time Factor)1,以提升用戶體驗(yàn)和服務(wù)吞吐率。

除了性能之外,總體擁有成本(TCO)也是重要的考量因素。雖然基于 GPU 的 AI 服務(wù)器能夠在性能上滿足聲學(xué)訓(xùn)練與推理的需求,但是采購、部署與運(yùn)維成本較高,而且其較為復(fù)雜的采購流程意味著較高的時(shí)間成本,難以實(shí)現(xiàn)快速的敏捷擴(kuò)展。相較之下,基于 CPU 的 AI 服務(wù)器能夠高效利用已有硬件的基礎(chǔ)設(shè)施,在大量應(yīng)用場(chǎng)景下有著更高的 TCO 優(yōu)勢(shì)。

解決方案:一起教育科技基于英特爾架構(gòu)優(yōu)化 AI 處理能力

為了向師生提供更卓越的口語教育服務(wù),一起教育科技從應(yīng)用與基礎(chǔ)設(shè)施兩個(gè)方面進(jìn)行了針對(duì)性的設(shè)計(jì)與優(yōu)化。從應(yīng)用層面來看,為了給各地的教師和學(xué)生提供一套符合課標(biāo)、以及地方考試統(tǒng)一要求的評(píng)分標(biāo)準(zhǔn),滿足日常練習(xí)、課后作業(yè)、形成性和過程性評(píng)價(jià)、以及考試評(píng)測(cè)等各個(gè)場(chǎng)景下的英語口語活動(dòng)需求,一起教育科技認(rèn)真研究分析了全國近三十個(gè)省市的英語口語考試評(píng)測(cè)標(biāo)準(zhǔn)和《中學(xué)英語課程標(biāo)準(zhǔn)》,制訂了一套具有普適性的通用評(píng)分標(biāo)準(zhǔn)。

一起作業(yè) AI 口語測(cè)評(píng)平臺(tái)能夠嚴(yán)格按照這一通用打分標(biāo)準(zhǔn)對(duì)學(xué)生的作答進(jìn)行評(píng)判,其使用了全國各地的題型對(duì)此套標(biāo)準(zhǔn)進(jìn)行了檢驗(yàn),并運(yùn)用技術(shù)手段和大批量數(shù)據(jù)統(tǒng)計(jì)的方式進(jìn)行復(fù)核,證明其在對(duì)各式題型、各地區(qū)評(píng)分要求的適應(yīng),以及運(yùn)用分?jǐn)?shù)手段明確顯示學(xué)生口語水準(zhǔn)方面都有著良好的效果。

在基礎(chǔ)設(shè)施層面,一起教育科技采用了搭載英特爾 至強(qiáng) 金牌 6230 處理器的 AI 服務(wù)器來承載智能口語測(cè)評(píng)服務(wù)。英特爾 至強(qiáng) 金牌 6230 處理器屬于第二代英特爾 至強(qiáng) 可擴(kuò)展處理器家族,為計(jì)算密集型工作負(fù)載提供了高性能和可擴(kuò)展性。該處理器集成了英特爾 超級(jí)通道互聯(lián)(英特爾 UPI)、英特爾 Infrastructure Management 技術(shù)(英特爾 IMT)和英特爾 高級(jí)矢量擴(kuò)展指令集512(英特爾 AVX-512)等領(lǐng)先功能,可滿足嚴(yán)苛的 I/O 密集型工作負(fù)載的需求。

尤為重要的是,第二代英特爾 至強(qiáng) 可擴(kuò)展處理器還內(nèi)置人工智能加速功能,并已針對(duì)工作負(fù)載進(jìn)行優(yōu)化,能夠?yàn)楦鞣N高性能計(jì)算工作負(fù)載、AI應(yīng)用以及高密度基礎(chǔ)設(shè)施帶來一流的性能和內(nèi)存帶寬。同時(shí),采用矢量神經(jīng)網(wǎng)絡(luò)指令(VNNI)的英特爾 深度學(xué)習(xí)加速(英特爾 DL Boost)顯著提高了人工智能推理的表現(xiàn),這使其成為一起教育科技在云平臺(tái)上拓展 AI 應(yīng)用的卓越基礎(chǔ)設(shè)施。

為了驗(yàn)證基于英特爾 至強(qiáng) 金牌 6230 處理器的 AI 服務(wù)器帶來的性能提升,一起教育科技搭建了測(cè)試環(huán)境,測(cè)試配置如表 1 所示:

一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

一起作業(yè) AI 口語測(cè)評(píng)平臺(tái)的工作流包含多個(gè)模塊,一起教育科技聯(lián)合英特爾使用英特爾 VTune™ Profiler可視化性能分析器工具分析計(jì)算熱點(diǎn),引入VNNI指令集優(yōu)化熱點(diǎn)函數(shù),再將GCC更換成英特爾 C++ 編譯器,進(jìn)行重新編譯。完成優(yōu)化后,測(cè)試人員在一顆英特爾 至強(qiáng) 金牌 6230 處理器上并發(fā)處理40路推理線程,發(fā)現(xiàn)整個(gè)工作流的實(shí)時(shí)率下降了 12.7%2,優(yōu)化后和優(yōu)化前的性能對(duì)比如圖 2 所示:

一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

一起教育科技還將口語評(píng)測(cè)的優(yōu)化方法遷移到語音識(shí)別上,即便之前已經(jīng)做了重構(gòu)和深度優(yōu)化,VNNI指令集和英特爾 C++ 編譯器仍然帶來了一定的性能提升,同時(shí)最大程度地發(fā)揮了CPU的算力。在同樣40路并發(fā)的情況下,整個(gè)工作流的實(shí)時(shí)率比優(yōu)化前下降了5%3,優(yōu)化前后的性能對(duì)比如圖 3 所示:

一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

語音合成是用于教學(xué)場(chǎng)景的一種重要的工作負(fù)載,該業(yè)務(wù)包含前端,聲學(xué)模型和聲碼器。聲碼器用的是LPCNet,該聲碼器是一個(gè)C語言版本,在不改變代碼的情況下,使用英特爾編譯器的高級(jí)選項(xiàng)來進(jìn)行優(yōu)化,使整個(gè)工作流的實(shí)時(shí)率比優(yōu)化前降低了72.1%,處理效率提升了2.58倍4,優(yōu)化前后的性能對(duì)比如圖 4 所示。

一起教育科技基于英特爾 技術(shù)優(yōu)化 AI 口語測(cè)評(píng)平臺(tái) 賦能英語教學(xué)

成果:助力學(xué)生高效提升英語口語水平

一起教育科技與英特爾的合作為 AI 口語測(cè)評(píng)平臺(tái)奠定了堅(jiān)實(shí)的基礎(chǔ),不僅有效降低了實(shí)時(shí)率,滿足了口語測(cè)評(píng)服務(wù)實(shí)時(shí)響應(yīng)的需求,還能夠支撐業(yè)務(wù)高峰期海量的服務(wù)請(qǐng)求,降低基礎(chǔ)設(shè)施壓力。具體而言,雙方的合作實(shí)現(xiàn)了如下成果:

口語測(cè)評(píng)結(jié)果“秒速”提供:由于口語評(píng)測(cè)實(shí)時(shí)率的降低,學(xué)生在進(jìn)行口語練習(xí)并提交平臺(tái)評(píng)測(cè)之后,平臺(tái)能夠近即時(shí)地將評(píng)測(cè)結(jié)果反饋給學(xué)生,以便其進(jìn)行針對(duì)性的糾正與學(xué)習(xí)。而語音識(shí)別與語音合成性能的提升,則為用戶的口語學(xué)習(xí)提供了更高效的跟讀訓(xùn)練、智能對(duì)話等服務(wù)。

口語測(cè)評(píng)服務(wù)始終穩(wěn)定如一:得益于第二代英特爾 至強(qiáng) 可擴(kuò)展處理器的高性能,以及一起教育科技在混合云架構(gòu)與服務(wù)方面的創(chuàng)新,一起教育科技可以確保在高峰期也能為用戶提供穩(wěn)定高效的評(píng)測(cè)服務(wù),避免響應(yīng)緩慢等問題。

TCO 得到顯著控制:相較于 GPU 服務(wù)器,基于第二代英特爾 至強(qiáng) 可擴(kuò)展處理器的 AI 服務(wù)器有著更為顯著的 TCO 優(yōu)勢(shì),能夠幫助一起教育科技在業(yè)務(wù)的快速擴(kuò)展過程中,提升投資回報(bào)率,為師生帶來更具價(jià)值的服務(wù)。

一起教育科技AI Lab負(fù)責(zé)人饒豐指出:“我們與英特爾建立了良好的合作關(guān)系,推動(dòng)了 AI 口語測(cè)評(píng)平臺(tái)的性能持續(xù)優(yōu)化?;谠摶A(chǔ)設(shè)施平臺(tái),我們時(shí)刻跟隨各地區(qū)教學(xué)實(shí)踐要求的變化,為老師們提供更加精準(zhǔn)的分?jǐn)?shù)評(píng)判體系,為學(xué)子們提供更加有效的學(xué)情反饋,為推動(dòng)全國各地區(qū)英語口語教學(xué)的不斷進(jìn)步而貢獻(xiàn)力量。”

未來展望:加速智慧教育革新

一起教育科技透露,其未來將在三個(gè)方向推動(dòng)口語評(píng)測(cè)平臺(tái)的優(yōu)化與革新:首先是全開放口語題的評(píng)測(cè)支持;其次是中小學(xué)生口語能力水平的評(píng)定,從多個(gè)維度評(píng)價(jià)口語的應(yīng)用能力,更契合教育部的中小學(xué)學(xué)科核心素養(yǎng)的評(píng)價(jià);第三個(gè)方向是提供滿足地區(qū)化差異的評(píng)測(cè)方案,實(shí)現(xiàn)語音評(píng)測(cè)的本地化,根據(jù)地區(qū)教育水平的差異進(jìn)行本地化的適配。

為了支撐以上三大目標(biāo)的實(shí)現(xiàn),一起教育科技將與英特爾圍繞創(chuàng)新硬件選型、AI 性能優(yōu)化等方面進(jìn)行更加深入的合作,發(fā)揮英特爾在端到端 AI 產(chǎn)品與技術(shù)方面的優(yōu)勢(shì),從而為 AI教育應(yīng)用提供強(qiáng)大的算力支持,實(shí)現(xiàn)跨架構(gòu)的算法移植與優(yōu)化,進(jìn)而賦能智慧教育,提供高效、公平、個(gè)性化的教育服務(wù)。

關(guān)于一起教育科技

一起教育科技(NASDAQ: YQ)是全球領(lǐng)先的K12智能教育平臺(tái)。懷著“讓學(xué)習(xí)成為美好體驗(yàn)”的使命,一起教育科技致力于用先進(jìn)的教育科技、優(yōu)質(zhì)的教育內(nèi)容和持續(xù)的教育熱情,為K12階段的學(xué)校、家庭、社會(huì)教育場(chǎng)景,提供更為高效、美好的產(chǎn)品和體驗(yàn),開啟了智能教育新時(shí)代。

關(guān)于英特爾

英特爾(NASDAQ: INTC)作為行業(yè)引領(lǐng)者,創(chuàng)造改變世界的技術(shù),推動(dòng)全球進(jìn)步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進(jìn)半導(dǎo)體設(shè)計(jì)與制造,幫助我們的客戶應(yīng)對(duì)最重大的挑戰(zhàn)。通過將智能融入云、網(wǎng)絡(luò)、邊緣和各種計(jì)算設(shè)備,我們釋放數(shù)據(jù)潛能,助力商業(yè)和社會(huì)變得更美好。如需了解英特爾創(chuàng)新的更多信息,請(qǐng)?jiān)L問英特爾中國新聞中心newsroom.intel.cn以及官方網(wǎng)站intel.cn。

1實(shí)時(shí)率(RTF,Real Time Factor)是一個(gè)常用于度量自動(dòng)語音識(shí)別系統(tǒng)解碼速度的值。它也可以用在以近似恒定速率處理視頻或音頻信號(hào)的處理中(比方說從CD中讀音樂)。如果處理一段長度為a的音頻信號(hào)需要花費(fèi)時(shí)間b,則實(shí)時(shí)率為b/a。如果,如果處理一段長度為2小時(shí)的音頻花了8個(gè)小時(shí),則實(shí)時(shí)率為8/2=4。當(dāng)實(shí)時(shí)率等于或小于1時(shí)通常認(rèn)為該處理是實(shí)時(shí)的。

2,3,4測(cè)試數(shù)據(jù)由一起教育科技測(cè)試得出。測(cè)試配置:英特爾至強(qiáng) 金牌 6230 處理器 @ 2.10GHz,192G DDR4 2933*6,CentOS Linux 8 (Core),Kernel 4.18.0-193.19.1.el8_2.x86_64,英特爾 C++ 編譯器v19.1,GUN 編譯器套件v7.3,Python v3.6

英特爾并不控制或?qū)徲?jì)第三方數(shù)據(jù)。請(qǐng)您自行審核該等內(nèi)容、咨詢其他來源,并確認(rèn)提及數(shù)據(jù)是否準(zhǔn)確。

性能結(jié)果因使用方式、配置和其他因素而異。更多信息敬請(qǐng)登陸www.Intel.com/PerformanceIndex。

本文并未(明示或默示、或通過禁止反言或以其他方式)授予任何知識(shí)產(chǎn)權(quán)許可。英特爾未做出任何明示和默示的保證,包括但不限于,關(guān)于適銷性、適合特定目的及不侵權(quán)的默示保證,以及在履約過程、交易過程或貿(mào)易慣例中引起的任何保證。

英特爾運(yùn)營所需的任何商品和服務(wù)預(yù)測(cè)僅供討論。就與本文中公布的預(yù)測(cè),英特爾不負(fù)有任何購買責(zé)任。本文中提供的所有信息可在不通知的情況下隨時(shí)發(fā)生變更。關(guān)于英特爾最新的產(chǎn)品規(guī)格和路線圖,請(qǐng)聯(lián)系您的英特爾代表。

英特爾技術(shù)特性和優(yōu)勢(shì)取決于系統(tǒng)配置,并可能需要支持的硬件、軟件或服務(wù)得以激活。產(chǎn)品性能會(huì)基于系統(tǒng)配置有所變化。沒有任何產(chǎn)品或組件是絕對(duì)安全的。更多信息請(qǐng)從原始設(shè)備制造商或零售商處獲得,或請(qǐng)見 intel.com

在特定系統(tǒng)的特殊測(cè)試中測(cè)試組件性能。硬件、軟件或配置的差異將影響實(shí)際性能。當(dāng)您考慮采購時(shí),請(qǐng)查閱其他信息來源評(píng)估性能。關(guān)于性能和基準(zhǔn)測(cè)試程序結(jié)果的更多信息,請(qǐng)?jiān)L問:www.intel.com/benchmarks

英特爾、英特爾標(biāo)識(shí)以及其他英特爾商標(biāo)是英特爾公司或其子公司在美國和/或其他國家的商標(biāo)。文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。

© 英特爾公司版權(quán)所有

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )