在線測評:噱頭大于實效還是技術(shù)惠及大眾?

任誰再獨善其身也很難不被朋友圈中的“測一測”吸引目光。娛樂性質(zhì)的測試小程序,以測試為噱頭做著各種產(chǎn)品、服務(wù)的營銷買賣,那些在線教育的語言評測呢?所謂人工智能技術(shù)和教育結(jié)合的產(chǎn)物,智能評測是否真實有效,測評最終又能達到什么目的?

兩分鐘測出英文水平?

不管是朋友圈還是主流在線教育App,在線測評似乎成為了一種標(biāo)配。以英語學(xué)習(xí)App為例,“ 10道題測出你的英語水平”、“2分鐘測出你的英語水平”、“你能在雅思考試中拿幾分”……各式各樣的自測題,多以選擇題的形式出現(xiàn),而這種不花費過多時間就能獲得結(jié)果的方式,著實吸引了不少目光。

這些題庫中題型設(shè)置大部分比較簡單,難度設(shè)計平平。用戶在社交媒體平臺上看到這些題目并完成答題后,都會被引導(dǎo)填寫電話號碼等個人信息,同時可以看到提示,只有填寫完善信息才能獲得自測的結(jié)果,有的甚至要求轉(zhuǎn)發(fā)。如果,用戶在在線語言學(xué)習(xí)App內(nèi)部進行自我測試或等級評定,就會收到推薦學(xué)習(xí)的課程。

通過社交媒體平臺引導(dǎo)用戶的測試題,很明顯具有營銷的因素。社交平臺成為在線教育營銷主要進攻的場景,與近年來在社交平臺火爆的知識付費有一定相同之處。英語對于學(xué)習(xí)、工作越來越重要,用戶的付費態(tài)度更顯得積極。

另外,擁有10億用戶的微信,讓朋友圈口碑成為刺激消費的重要通道。因此,在線教育平臺一方面鼓勵用戶在微信朋友圈分享打卡,博得更多用戶體驗產(chǎn)品的可能,另一方面,用各種簡單、高效的自測題圈定用戶引流,形成良好的營銷效應(yīng)。即使這些所謂能夠讓人分分鐘搞清自身水平的題庫并無真實效果,但平臺的目的卻達到了。

測評的本質(zhì)到底是不是AI

在線測評的概念無疑是隨著整個自適應(yīng)學(xué)習(xí)的興起而來。

自適應(yīng)學(xué)習(xí)是一種較為先進的教育科技手段,通過自主提供適合每位學(xué)生的獨立幫助,引導(dǎo)學(xué)生下一步學(xué)習(xí)內(nèi)容和活動,當(dāng)學(xué)生在學(xué)習(xí)過程中遇到課程難度過高或過低時,課程的難易程度都可以自動調(diào)整,從而實現(xiàn)可規(guī)模化的個性化教育。一般而言,測評是自適應(yīng)學(xué)習(xí)產(chǎn)品最常應(yīng)用的在線教育場景。

自適應(yīng)學(xué)習(xí)中的測評主要依賴學(xué)習(xí)過程數(shù)據(jù)、考試結(jié)果等來測評,測評比較全面、精準(zhǔn),并能夠支持學(xué)習(xí)過程的動態(tài)優(yōu)化,有助于教學(xué)效率的提升。

其實,在線測評的需求是真實的,很多的公司將技術(shù)的力量投入于此,對外都宣稱自己的技術(shù)更為領(lǐng)先,但是我們需要先問一個問題,測評的核心真的是AI技術(shù)嗎?

或許未必。因為保證任何算法的有效性最關(guān)鍵因素是正確的模型,對于教育而言,有效的模型,能夠最大程度地保證信度和準(zhǔn)度的測評題目設(shè)置,才是最根本的。

以語言測評為例,朗播網(wǎng)此前上線的「雅思托福測評小程序」,依托全球首款托福自適應(yīng)學(xué)習(xí)系統(tǒng),深度挖掘了學(xué)員數(shù)據(jù),全面覆蓋了19個核心能力點,設(shè)置了10-15分鐘時長的測試內(nèi)容,能夠更精準(zhǔn)的測試出用戶的真實水平。

據(jù)朗播網(wǎng)創(chuàng)始人&CEO杜昶旭介紹:從語言測評模型上來看:基礎(chǔ)其實是能力圖譜/量表,定性描述不能解決本質(zhì)問題,最關(guān)鍵的是標(biāo)準(zhǔn)化的定量描述。要想量化一個人的語言能力,追根溯源還是要用測量學(xué)的方法,來評測一個學(xué)生的語言能力。因此針對語言類的考試完全區(qū)別于數(shù)學(xué)等以知識點為導(dǎo)向的學(xué)科,是不會有太多所謂“規(guī)律性”的東西,反而是對考生能力的描繪。

從語言測評內(nèi)容上來看:語言測評我是完全不主張用真題去測試的(雖然市面上很多測評都是拿了真題就包裝成測評給用戶),應(yīng)該是基于能力模型自主定義測試題,測試題之間交叉對應(yīng)能力點,反映用戶的趨勢和現(xiàn)狀。

從語言測評技術(shù)層面來看:一般來說,為了測量一個能力點,通常需要3-5道測試題。為了簡化測驗過程,我們依據(jù)知識之間的關(guān)聯(lián)程度構(gòu)造了一個特殊的神經(jīng)網(wǎng)絡(luò),找到題與題之間的關(guān)聯(lián),朗播網(wǎng)現(xiàn)在研究的,就是如何基于基于貝葉斯和IRT模型的神經(jīng)網(wǎng)絡(luò)算法,來優(yōu)化這個測評的過程并提高準(zhǔn)確性。

除了優(yōu)化自適應(yīng)測評技術(shù),朗播網(wǎng)還不斷發(fā)力語音、圖像識別和NLP,即機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的應(yīng)用,以及用機器來解決用戶學(xué)習(xí)過程數(shù)據(jù)收集分析,基于分析生成形成性的評價和結(jié)果的預(yù)測。

完成自適應(yīng)學(xué)習(xí)閉環(huán),測評只是第一步

測評與體檢類似,體檢發(fā)現(xiàn)身體的問題,但是不會給出治療方案。真實有效的測評通過技術(shù)和模型的力量發(fā)現(xiàn)了問題,接下來應(yīng)該考慮的就是誰來解決問題,以及怎么解決問題。

人工智能自適應(yīng)教育最早發(fā)展出的功能是反映學(xué)生的能力水平(測試功能),后來逐漸加入找出知識點盲區(qū)(評價功能)、推送內(nèi)容彌補盲區(qū)(學(xué)習(xí)功能)的功能,但目前所推送的學(xué)習(xí)內(nèi)容表現(xiàn)形式仍然是視頻、題目等舊形式,背后的學(xué)習(xí)方式是傳統(tǒng)的“聽課”和“刷題”,這是由教學(xué)思路的固化導(dǎo)致的。按照傳統(tǒng)的在線教育以及線下培訓(xùn)機構(gòu)的做法,從自測環(huán)節(jié)就已落后,更不用說形成有效的閉環(huán)了。

從自適應(yīng)學(xué)習(xí)的角度來看,測評只是形成整個閉環(huán)的第一步。以朗播網(wǎng)為例,用戶在朗播網(wǎng)通過自行測試,完成對自身英語能力的檢測。測驗完成后,朗播網(wǎng)會依據(jù)模型,用可視化的方法描述用戶的英語能力,并依據(jù)用戶的不同情況,給予其不同的解決方案。

除了初次的測評以外,用戶在朗播網(wǎng)學(xué)習(xí)還需要每完成10套任務(wù)包后再進行測評,通常是10-15天,測試也會使用戶的能力更貼合應(yīng)該達到的要求,并且結(jié)合個性化學(xué)習(xí)計劃,繼續(xù)推薦更為適合的學(xué)習(xí)方案。

涉及到機器學(xué)習(xí)的,數(shù)據(jù)都是非常重要的,尤其是對個性化要求極高的自適應(yīng)學(xué)習(xí)。教學(xué)不應(yīng)該是單方面給予的過程,學(xué)習(xí)不是把線下培訓(xùn)方法照搬到線上,而是成體系化、模塊化的,隨著用戶能力提高,系統(tǒng)也可以實現(xiàn)升級,結(jié)合教研與數(shù)據(jù)就是在線教育實現(xiàn)個性化教學(xué)的完備路徑。

在線教育競爭逐漸升溫,傳統(tǒng)營銷手段無法突出平臺優(yōu)勢,如何讓數(shù)據(jù)大量沉淀下來,發(fā)揮人工智能和機器學(xué)習(xí)的技術(shù)優(yōu)勢,真正利用技術(shù)解決自適應(yīng)學(xué)習(xí)的問題,形成有效的閉環(huán),才是未來在線教育抓住當(dāng)前機遇,獲得競爭優(yōu)勢的著力點。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-18
在線測評:噱頭大于實效還是技術(shù)惠及大眾?
任誰再獨善其身也很難不被朋友圈中的“測一測”吸引目光。娛樂性質(zhì)的測試小程序,以測試為噱頭做著各種產(chǎn)品、服務(wù)...

長按掃碼 閱讀全文