在線測(cè)評(píng):噱頭大于實(shí)效還是技術(shù)惠及大眾?

AI?

在線測(cè)評(píng)的概念無疑是隨著整個(gè)自適應(yīng)學(xué)習(xí)的興起而來。

自適應(yīng)學(xué)習(xí)是一種較為先進(jìn)的教育科技手段,通過自主提供適合每位學(xué)生的獨(dú)立幫助,引導(dǎo)學(xué)生下一步學(xué)習(xí)內(nèi)容和活動(dòng),當(dāng)學(xué)生在學(xué)習(xí)過程中遇到課程難度過高或過低時(shí),課程的難易程度都可以自動(dòng)調(diào)整,從而實(shí)現(xiàn)可規(guī)?;膫€(gè)性化教育。一般而言,測(cè)評(píng)是自適應(yīng)學(xué)習(xí)產(chǎn)品最常應(yīng)用的在線教育場(chǎng)景。

自適應(yīng)學(xué)習(xí)中的測(cè)評(píng)主要依賴學(xué)習(xí)過程數(shù)據(jù)、考試結(jié)果等來測(cè)評(píng),測(cè)評(píng)比較全面、精準(zhǔn),并能夠支持學(xué)習(xí)過程的動(dòng)態(tài)優(yōu)化,有助于教學(xué)效率的提升。

其實(shí),在線測(cè)評(píng)的需求是真實(shí)的,很多的公司將技術(shù)的力量投入于此,對(duì)外都宣稱自己的技術(shù)更為領(lǐng)先,但是我們需要先問一個(gè)問題,測(cè)評(píng)的核心真的是AI技術(shù)嗎?

或許未必。因?yàn)楸WC任何算法的有效性最關(guān)鍵因素是正確的模型,對(duì)于教育而言,有效的模型,能夠最大程度地保證信度和準(zhǔn)度的測(cè)評(píng)題目設(shè)置,才是最根本的。

以語言測(cè)評(píng)為例,朗播網(wǎng)此前上線的「雅思托福測(cè)評(píng)小程序」,依托全球首款托福自適應(yīng)學(xué)習(xí)系統(tǒng),深度挖掘了學(xué)員數(shù)據(jù),全面覆蓋了19個(gè)核心能力點(diǎn),設(shè)置了10-15分鐘時(shí)長(zhǎng)的測(cè)試內(nèi)容,能夠更精準(zhǔn)的測(cè)試出用戶的真實(shí)水平。

據(jù)朗播網(wǎng)創(chuàng)始人&CEO杜昶旭介紹:從語言測(cè)評(píng)模型上來看:基礎(chǔ)其實(shí)是能力圖譜/量表,定性描述不能解決本質(zhì)問題,最關(guān)鍵的是標(biāo)準(zhǔn)化的定量描述。要想量化一個(gè)人的語言能力,追根溯源還是要用測(cè)量學(xué)的方法,來評(píng)測(cè)一個(gè)學(xué)生的語言能力。因此針對(duì)語言類的考試完全區(qū)別于數(shù)學(xué)等以知識(shí)點(diǎn)為導(dǎo)向的學(xué)科,是不會(huì)有太多所謂“規(guī)律性”的東西,反而是對(duì)考生能力的描繪。

從語言測(cè)評(píng)內(nèi)容上來看:語言測(cè)評(píng)我是完全不主張用真題去測(cè)試的(雖然市面上很多測(cè)評(píng)都是拿了真題就包裝成測(cè)評(píng)給用戶),應(yīng)該是基于能力模型自主定義測(cè)試題,測(cè)試題之間交叉對(duì)應(yīng)能力點(diǎn),反映用戶的趨勢(shì)和現(xiàn)狀。

從語言測(cè)評(píng)技術(shù)層面來看:一般來說,為了測(cè)量一個(gè)能力點(diǎn),通常需要3-5道測(cè)試題。為了簡(jiǎn)化測(cè)驗(yàn)過程,我們依據(jù)知識(shí)之間的關(guān)聯(lián)程度構(gòu)造了一個(gè)特殊的神經(jīng)網(wǎng)絡(luò),找到題與題之間的關(guān)聯(lián),朗播網(wǎng)現(xiàn)在研究的,就是如何基于基于貝葉斯和IRT模型的神經(jīng)網(wǎng)絡(luò)算法,來優(yōu)化這個(gè)測(cè)評(píng)的過程并提高準(zhǔn)確性。

除了優(yōu)化自適應(yīng)測(cè)評(píng)技術(shù),朗播網(wǎng)還不斷發(fā)力語音、圖像識(shí)別和NLP,即機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的應(yīng)用,以及用機(jī)器來解決用戶學(xué)習(xí)過程數(shù)據(jù)收集分析,基于分析生成形成性的評(píng)價(jià)和結(jié)果的預(yù)測(cè)。

完成自適應(yīng)學(xué)習(xí)閉環(huán),測(cè)評(píng)只是第一步

測(cè)評(píng)與體檢類似,體檢發(fā)現(xiàn)身體的問題,但是不會(huì)給出治療方案。真實(shí)有效的測(cè)評(píng)通過技術(shù)和模型的力量發(fā)現(xiàn)了問題,接下來應(yīng)該考慮的就是誰來解決問題,以及怎么解決問題。

人工智能自適應(yīng)教育最早發(fā)展出的功能是反映學(xué)生的能力水平(測(cè)試功能),后來逐漸加入找出知識(shí)點(diǎn)盲區(qū)(評(píng)價(jià)功能)、推送內(nèi)容彌補(bǔ)盲區(qū)(學(xué)習(xí)功能)的功能,但目前所推送的學(xué)習(xí)內(nèi)容表現(xiàn)形式仍然是視頻、題目等舊形式,背后的學(xué)習(xí)方式是傳統(tǒng)的“聽課”和“刷題”,這是由教學(xué)思路的固化導(dǎo)致的。按照傳統(tǒng)的在線教育以及線下培訓(xùn)機(jī)構(gòu)的做法,從自測(cè)環(huán)節(jié)就已落后,更不用說形成有效的閉環(huán)了。

從自適應(yīng)學(xué)習(xí)的角度來看,測(cè)評(píng)只是形成整個(gè)閉環(huán)的第一步。以朗播網(wǎng)為例,用戶在朗播網(wǎng)通過自行測(cè)試,完成對(duì)自身英語能力的檢測(cè)。測(cè)驗(yàn)完成后,朗播網(wǎng)會(huì)依據(jù)模型,用可視化的方法描述用戶的英語能力,并依據(jù)用戶的不同情況,給予其不同的解決方案。

除了初次的測(cè)評(píng)以外,用戶在朗播網(wǎng)學(xué)習(xí)還需要每完成10套任務(wù)包后再進(jìn)行測(cè)評(píng),通常是10-15天,測(cè)試也會(huì)使用戶的能力更貼合應(yīng)該達(dá)到的要求,并且結(jié)合個(gè)性化學(xué)習(xí)計(jì)劃,繼續(xù)推薦更為適合的學(xué)習(xí)方案。

涉及到機(jī)器學(xué)習(xí)的,數(shù)據(jù)都是非常重要的,尤其是對(duì)個(gè)性化要求極高的自適應(yīng)學(xué)習(xí)。教學(xué)不應(yīng)該是單方面給予的過程,學(xué)習(xí)不是把線下培訓(xùn)方法照搬到線上,而是成體系化、模塊化的,隨著用戶能力提高,系統(tǒng)也可以實(shí)現(xiàn)升級(jí),結(jié)合教研與數(shù)據(jù)就是在線教育實(shí)現(xiàn)個(gè)性化教學(xué)的完備路徑。

在線教育競(jìng)爭(zhēng)逐漸升溫,傳統(tǒng)營(yíng)銷手段無法突出平臺(tái)優(yōu)勢(shì),如何讓數(shù)據(jù)大量沉淀下來,發(fā)揮人工智能和機(jī)器學(xué)習(xí)的技術(shù)優(yōu)勢(shì),真正利用技術(shù)解決自適應(yīng)學(xué)習(xí)的問題,形成有效的閉環(huán),才是未來在線教育抓住當(dāng)前機(jī)遇,獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的著力點(diǎn)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-18
在線測(cè)評(píng):噱頭大于實(shí)效還是技術(shù)惠及大眾?
任誰再獨(dú)善其身也很難不被朋友圈中的“測(cè)一測(cè)”吸引目光。娛樂性質(zhì)的測(cè)試小程序,以測(cè)試為噱頭做著各種產(chǎn)品、服務(wù)...

長(zhǎng)按掃碼 閱讀全文