概述
人工智能 (AI) 技術的廣泛應用深度改變了教育的形態(tài),催生了蓬勃發(fā)展的智慧教育。得益于數(shù)據的不斷積累、算力的不斷突破、以及算法的持續(xù)創(chuàng)新,基于AI的計算機視覺、語音交互、自然語言理解等應用在教育行業(yè)得到了快速發(fā)展,能夠通過深入挖掘端到端的海量教育數(shù)據價值,為教學工作提供出色支持,從而顯著降低教師的教學負擔,提升教學的精準性、有效性、針對性。
一起教育科技近年來持續(xù)強化“AI+教育”的融合,并在旗下的免費學習工具“一起作業(yè)”中推出了應用 AI 技術、可以對學生英語口語水平進行準確測評的一起作業(yè) AI 口語測評平臺,致力于為老師們提供更加精準的分數(shù)評判體系,為學生們提供更加有效的學情反饋。為提升基礎設施平臺對于海量業(yè)務的支撐能力,為師生提供更高效的智能口語測評服務,一起教育科技使用第二代英特爾 至強 可擴展處理器搭建了 AI 服務器,顯著提升了性能表現(xiàn),不僅能夠支撐億級日均調用量的需求,而且在總體擁有成本 (TCO) 方面具備出色優(yōu)勢。
背景:AI 技術助力降低口語學習門檻,提升學習效果
在英語學習過程中,口語是非常重要的一部分,為提升英語口語水平,全國諸多地區(qū)在中考英語中增加口語測試,各個學校作為英語教學的主體,廣泛強化了英語口語學習,并通過口語教學、口語測評、口語糾正等方式來提升學生的口語能力。在傳統(tǒng)口語學習場景中,要評判口語水平,往往需要師生以“一對一”的方式來進行,教師有限的時間和精力與學生大量的口語評判需求之間形成了尖銳的矛盾,學校需要能夠智能、準確地測評學生口語的平臺,以滿足口語學習的旺盛需求。
在此背景下,利用 AI 技術的口語測評平臺應運而生。此類平臺能夠利用計算機輔助語言學習(Computer Assisted Language Learning)等技術,將用戶口語發(fā)音所形成的音頻數(shù)據進行特征提取,并輸入到聲學模型。隨后,平臺會將聲學模型與語言模型進行融合計算,最終對于用戶的發(fā)音進行評分。其評測維度包括發(fā)音準確度、流暢度、自然度、完整度等,能夠幫助學生智能檢測口語學習成果。
一起教育科技AI Lab負責人饒豐指出:“AI 口語測評平臺的重要意義不僅在于其能夠提供一套高效、智能化、隨取隨用的口語評測能力,顯著降低學校與老師的教學負擔,還有利于彌補區(qū)域之間的教育質量鴻溝,推動教育公平。由于經濟發(fā)達區(qū)域與落后區(qū)域在口語教學資源方面存在巨大差異,導致大量三四線城市以及鄉(xiāng)村的中小學生難以獲得高質量的口語教育,口語評測的質量難以保證,而 AI 口語測評與在線教育的結合,能夠通過標準化、普適化的服務,讓偏遠地區(qū)的學生也能夠享受到優(yōu)秀的教育資源。”
基于在 AI 等技術方面的長期積累與創(chuàng)新,一起教育科技推出了搭載智能引擎的一起作業(yè) AI 口語測評平臺,該平臺在評測準確性、評測效率等方面都實現(xiàn)了突破,能夠真實地反映出學生當前口語的真實水平,并給出糾錯建議。目前,一起作業(yè)AI 口語測評平臺已經累計了千萬級用戶,日均服務調用量達到億級。
圖1. 一起作業(yè) AI 口語測評平臺
如此巨大的服務規(guī)模給后端基礎設施帶來了沉重的壓力。由于中小學口語教育的特殊性,每天的 19:00-21:00 是學生在線進行口語學習與測評的高峰期,服務瞬時并發(fā)量極高,一旦后端的 AI 基礎設施平臺無法承載如此巨大的服務并發(fā)量,可能導致服務速度變慢。此外,用戶對于 AI 口語測評的性能正在提出越來越高的要求,高實時性與低延遲正在成為用戶體驗的重要組成部分,一起教育科技希望能夠降低口語測評系統(tǒng)的實時率(RTF, Real Time Factor)1,以提升用戶體驗和服務吞吐率。
除了性能之外,總體擁有成本(TCO)也是重要的考量因素。雖然基于 GPU 的 AI 服務器能夠在性能上滿足聲學訓練與推理的需求,但是采購、部署與運維成本較高,而且其較為復雜的采購流程意味著較高的時間成本,難以實現(xiàn)快速的敏捷擴展。相較之下,基于 CPU 的 AI 服務器能夠高效利用已有硬件的基礎設施,在大量應用場景下有著更高的 TCO 優(yōu)勢。
解決方案:一起教育科技基于英特爾架構優(yōu)化 AI 處理能力
為了向師生提供更卓越的口語教育服務,一起教育科技從應用與基礎設施兩個方面進行了針對性的設計與優(yōu)化。從應用層面來看,為了給各地的教師和學生提供一套符合課標、以及地方考試統(tǒng)一要求的評分標準,滿足日常練習、課后作業(yè)、形成性和過程性評價、以及考試評測等各個場景下的英語口語活動需求,一起教育科技認真研究分析了全國近三十個省市的英語口語考試評測標準和《中學英語課程標準》,制訂了一套具有普適性的通用評分標準。
一起作業(yè) AI 口語測評平臺能夠嚴格按照這一通用打分標準對學生的作答進行評判,其使用了全國各地的題型對此套標準進行了檢驗,并運用技術手段和大批量數(shù)據統(tǒng)計的方式進行復核,證明其在對各式題型、各地區(qū)評分要求的適應,以及運用分數(shù)手段明確顯示學生口語水準方面都有著良好的效果。
在基礎設施層面,一起教育科技采用了搭載英特爾 至強 金牌 6230 處理器的 AI 服務器來承載智能口語測評服務。英特爾 至強 金牌 6230 處理器屬于第二代英特爾 至強 可擴展處理器家族,為計算密集型工作負載提供了高性能和可擴展性。該處理器集成了英特爾 超級通道互聯(lián)(英特爾 UPI)、英特爾 Infrastructure Management 技術(英特爾 IMT)和英特爾 高級矢量擴展指令集512(英特爾 AVX-512)等領先功能,可滿足嚴苛的 I/O 密集型工作負載的需求。
尤為重要的是,第二代英特爾 至強 可擴展處理器還內置人工智能加速功能,并已針對工作負載進行優(yōu)化,能夠為各種高性能計算工作負載、AI應用以及高密度基礎設施帶來一流的性能和內存帶寬。同時,采用矢量神經網絡指令(VNNI)的英特爾 深度學習加速(英特爾 DL Boost)顯著提高了人工智能推理的表現(xiàn),這使其成為一起教育科技在云平臺上拓展 AI 應用的卓越基礎設施。
為了驗證基于英特爾 至強 金牌 6230 處理器的 AI 服務器帶來的性能提升,一起教育科技搭建了測試環(huán)境,測試配置如表 1 所示:
一起作業(yè) AI 口語測評平臺的工作流包含多個模塊,一起教育科技聯(lián)合英特爾使用英特爾 VTune™ Profiler可視化性能分析器工具分析計算熱點,引入VNNI指令集優(yōu)化熱點函數(shù),再將GCC更換成英特爾 C++ 編譯器,進行重新編譯。完成優(yōu)化后,測試人員在一顆英特爾 至強 金牌 6230 處理器上并發(fā)處理40路推理線程,發(fā)現(xiàn)整個工作流的實時率下降了 12.7%2,優(yōu)化后和優(yōu)化前的性能對比如圖 2 所示:
一起教育科技還將口語評測的優(yōu)化方法遷移到語音識別上,即便之前已經做了重構和深度優(yōu)化,VNNI指令集和英特爾 C++ 編譯器仍然帶來了一定的性能提升,同時最大程度地發(fā)揮了CPU的算力。在同樣40路并發(fā)的情況下,整個工作流的實時率比優(yōu)化前下降了5%3,優(yōu)化前后的性能對比如圖 3 所示:
語音合成是用于教學場景的一種重要的工作負載,該業(yè)務包含前端,聲學模型和聲碼器。聲碼器用的是LPCNet,該聲碼器是一個C語言版本,在不改變代碼的情況下,使用英特爾編譯器的高級選項來進行優(yōu)化,使整個工作流的實時率比優(yōu)化前降低了72.1%,處理效率提升了2.58倍4,優(yōu)化前后的性能對比如圖 4 所示。
成果:助力學生高效提升英語口語水平
一起教育科技與英特爾的合作為 AI 口語測評平臺奠定了堅實的基礎,不僅有效降低了實時率,滿足了口語測評服務實時響應的需求,還能夠支撐業(yè)務高峰期海量的服務請求,降低基礎設施壓力。具體而言,雙方的合作實現(xiàn)了如下成果:
口語測評結果“秒速”提供:由于口語評測實時率的降低,學生在進行口語練習并提交平臺評測之后,平臺能夠近即時地將評測結果反饋給學生,以便其進行針對性的糾正與學習。而語音識別與語音合成性能的提升,則為用戶的口語學習提供了更高效的跟讀訓練、智能對話等服務。
口語測評服務始終穩(wěn)定如一:得益于第二代英特爾 至強 可擴展處理器的高性能,以及一起教育科技在混合云架構與服務方面的創(chuàng)新,一起教育科技可以確保在高峰期也能為用戶提供穩(wěn)定高效的評測服務,避免響應緩慢等問題。
TCO 得到顯著控制:相較于 GPU 服務器,基于第二代英特爾 至強 可擴展處理器的 AI 服務器有著更為顯著的 TCO 優(yōu)勢,能夠幫助一起教育科技在業(yè)務的快速擴展過程中,提升投資回報率,為師生帶來更具價值的服務。
一起教育科技AI Lab負責人饒豐指出:“我們與英特爾建立了良好的合作關系,推動了 AI 口語測評平臺的性能持續(xù)優(yōu)化?;谠摶A設施平臺,我們時刻跟隨各地區(qū)教學實踐要求的變化,為老師們提供更加精準的分數(shù)評判體系,為學子們提供更加有效的學情反饋,為推動全國各地區(qū)英語口語教學的不斷進步而貢獻力量。”
未來展望:加速智慧教育革新
一起教育科技透露,其未來將在三個方向推動口語評測平臺的優(yōu)化與革新:首先是全開放口語題的評測支持;其次是中小學生口語能力水平的評定,從多個維度評價口語的應用能力,更契合教育部的中小學學科核心素養(yǎng)的評價;第三個方向是提供滿足地區(qū)化差異的評測方案,實現(xiàn)語音評測的本地化,根據地區(qū)教育水平的差異進行本地化的適配。
為了支撐以上三大目標的實現(xiàn),一起教育科技將與英特爾圍繞創(chuàng)新硬件選型、AI 性能優(yōu)化等方面進行更加深入的合作,發(fā)揮英特爾在端到端 AI 產品與技術方面的優(yōu)勢,從而為 AI教育應用提供強大的算力支持,實現(xiàn)跨架構的算法移植與優(yōu)化,進而賦能智慧教育,提供高效、公平、個性化的教育服務。
關于一起教育科技
一起教育科技(NASDAQ: YQ)是全球領先的K12智能教育平臺。懷著“讓學習成為美好體驗”的使命,一起教育科技致力于用先進的教育科技、優(yōu)質的教育內容和持續(xù)的教育熱情,為K12階段的學校、家庭、社會教育場景,提供更為高效、美好的產品和體驗,開啟了智能教育新時代。
關于英特爾
英特爾(NASDAQ: INTC)作為行業(yè)引領者,創(chuàng)造改變世界的技術,推動全球進步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進半導體設計與制造,幫助我們的客戶應對最重大的挑戰(zhàn)。通過將智能融入云、網絡、邊緣和各種計算設備,我們釋放數(shù)據潛能,助力商業(yè)和社會變得更美好。如需了解英特爾創(chuàng)新的更多信息,請訪問英特爾中國新聞中心newsroom.intel.cn以及官方網站intel.cn。
1實時率(RTF,Real Time Factor)是一個常用于度量自動語音識別系統(tǒng)解碼速度的值。它也可以用在以近似恒定速率處理視頻或音頻信號的處理中(比方說從CD中讀音樂)。如果處理一段長度為a的音頻信號需要花費時間b,則實時率為b/a。如果,如果處理一段長度為2小時的音頻花了8個小時,則實時率為8/2=4。當實時率等于或小于1時通常認為該處理是實時的。
2,3,4測試數(shù)據由一起教育科技測試得出。測試配置:英特爾至強 金牌 6230 處理器 @ 2.10GHz,192G DDR4 2933*6,CentOS Linux 8 (Core),Kernel 4.18.0-193.19.1.el8_2.x86_64,英特爾 C++ 編譯器v19.1,GUN 編譯器套件v7.3,Python v3.6
英特爾并不控制或審計第三方數(shù)據。請您自行審核該等內容、咨詢其他來源,并確認提及數(shù)據是否準確。
性能結果因使用方式、配置和其他因素而異。更多信息敬請登陸www.Intel.com/PerformanceIndex。
本文并未(明示或默示、或通過禁止反言或以其他方式)授予任何知識產權許可。英特爾未做出任何明示和默示的保證,包括但不限于,關于適銷性、適合特定目的及不侵權的默示保證,以及在履約過程、交易過程或貿易慣例中引起的任何保證。
英特爾運營所需的任何商品和服務預測僅供討論。就與本文中公布的預測,英特爾不負有任何購買責任。本文中提供的所有信息可在不通知的情況下隨時發(fā)生變更。關于英特爾最新的產品規(guī)格和路線圖,請聯(lián)系您的英特爾代表。
英特爾技術特性和優(yōu)勢取決于系統(tǒng)配置,并可能需要支持的硬件、軟件或服務得以激活。產品性能會基于系統(tǒng)配置有所變化。沒有任何產品或組件是絕對安全的。更多信息請從原始設備制造商或零售商處獲得,或請見 intel.com
在特定系統(tǒng)的特殊測試中測試組件性能。硬件、軟件或配置的差異將影響實際性能。當您考慮采購時,請查閱其他信息來源評估性能。關于性能和基準測試程序結果的更多信息,請訪問:www.intel.com/benchmarks
英特爾、英特爾標識以及其他英特爾商標是英特爾公司或其子公司在美國和/或其他國家的商標。文中涉及的其它名稱及品牌屬于各自所有者資產。
© 英特爾公司版權所有
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )