平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)研究成果亮相國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議

近日,第二十六屆ICONIP國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亞悉尼召開(kāi),平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)(AutoML)----奧卡姆Occam平臺(tái)研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大會(huì)上進(jìn)行主題演講。這是繼在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競(jìng)賽獲得冠軍、獲得2019年CCF科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步杰出獎(jiǎng)后,平安科技奧卡姆平臺(tái)的又一項(xiàng)重大突破。

ICONIP會(huì)議是由亞太神經(jīng)網(wǎng)絡(luò)協(xié)會(huì)APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經(jīng)網(wǎng)絡(luò)領(lǐng)域最重要的會(huì)議之一。本次會(huì)議特別邀請(qǐng)到了神經(jīng)網(wǎng)絡(luò)領(lǐng)域權(quán)威專(zhuān)家David Powers 和 Bao-Liang Lu等嘉賓出席并進(jìn)行主題分享,并匯聚了來(lái)自世界各地從事人工智能理論和應(yīng)用研究的頂尖研究人員,共同分享國(guó)際人工智能研究領(lǐng)域的最新理論和技術(shù)成果。會(huì)議共收到1200+篇來(lái)自世界頂尖學(xué)府和科研機(jī)構(gòu)的論文投稿,最終錄用337篇,會(huì)議錄用率僅為27.4%,而受到邀請(qǐng)進(jìn)行主題演講的文章更是屈指可數(shù)。

平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)研究成果亮相國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議

圖1 第26屆ICONIP

平安科技奧卡姆平臺(tái)研究成果發(fā)布

平安科技奧卡姆平臺(tái)研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團(tuán)首席科學(xué)家肖京博士指導(dǎo),平安科技副總工程師王健宗博士作為論文的通訊作者,在會(huì)議錄用的337篇論文中脫穎而出,并受邀成為口頭報(bào)告論文。

奧卡姆平臺(tái)這篇論文針對(duì)OCR識(shí)別中未分段文本識(shí)別模型中的校準(zhǔn)異常問(wèn)題,創(chuàng)新性地將順序文字識(shí)別網(wǎng)絡(luò)(SRN)與校準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)(Calibration CNN)相結(jié)合,提出了一種將未分段文本轉(zhuǎn)化為單個(gè)字符并進(jìn)行識(shí)別校準(zhǔn)的新型算法。不同于傳統(tǒng)算法針對(duì)一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個(gè)文字提取出來(lái),雖然仍采用相同的識(shí)別模型,但是憑借奧卡姆平臺(tái)計(jì)算能力極強(qiáng)的優(yōu)勢(shì),可以并對(duì)不同的個(gè)體文字自適應(yīng)地選擇不同的校正參數(shù),調(diào)整每個(gè)文字識(shí)別結(jié)果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實(shí)應(yīng)用中,通過(guò)使用奧卡姆平臺(tái),高效、快速地在三個(gè)樣本集中試驗(yàn)了五種不同的CNN參數(shù)校準(zhǔn)方式,并得出了以DenseNet結(jié)構(gòu)的為基礎(chǔ)的最佳識(shí)別校準(zhǔn)算法。

平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)研究成果亮相國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議

圖2 奧卡姆論文提出的校準(zhǔn)方式

本論文的研究成果可利用在金融、保險(xiǎn)、醫(yī)療等領(lǐng)域?qū)ㄗC、財(cái)務(wù)票據(jù)等信息進(jìn)行智能識(shí)別錄入。以智能投保場(chǎng)景為例,用戶(hù)可利用論文中的技術(shù),對(duì)駕駛證、行駛證等證件上的未分段信息進(jìn)行識(shí)別,實(shí)現(xiàn)車(chē)主信息的自動(dòng)識(shí)別和錄入。在手機(jī)移動(dòng)投保、信息核實(shí)等過(guò)程中有效提升運(yùn)營(yíng)效率,優(yōu)化用戶(hù)體驗(yàn)。

定義全新的AI開(kāi)發(fā)模式,Occam平臺(tái)屢獲殊榮Occam平臺(tái)是平安集團(tuán)研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開(kāi)發(fā)平臺(tái),為用戶(hù)提供了從數(shù)據(jù)處理、算法開(kāi)發(fā)、模型訓(xùn)練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標(biāo)注、數(shù)據(jù)增強(qiáng)、多元模型自動(dòng)搜索、超參優(yōu)化、模型自動(dòng)壓縮、圖神經(jīng)網(wǎng)絡(luò)、聯(lián)邦學(xué)習(xí)、難例自動(dòng)發(fā)現(xiàn)等多種特色工具和服務(wù)。

平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)研究成果亮相國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議

圖3 奧卡姆平臺(tái)概覽

2019年,Occam平臺(tái)的多項(xiàng)優(yōu)秀成果得到國(guó)內(nèi)計(jì)算機(jī)領(lǐng)域權(quán)威學(xué)術(shù)團(tuán)體的肯定。不僅首次榮獲"2019年CCF科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步杰出獎(jiǎng)",還在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競(jìng)賽中,力壓由康奈爾大學(xué)和谷歌組成的豪華聯(lián)隊(duì),以7.579毫秒的驚人成績(jī)勇奪冠軍。

當(dāng)前Occam平臺(tái)已落地平安產(chǎn)險(xiǎn),并為平安聲紋、AI音樂(lè)、智能視覺(jué)等多個(gè)AI團(tuán)隊(duì)項(xiàng)目提供平臺(tái)支持。例如:Occam平臺(tái)實(shí)現(xiàn)了首個(gè)基于神經(jīng)架構(gòu)搜索的聲紋識(shí)別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個(gè)高精度聲紋識(shí)別模型,其效果遠(yuǎn)超過(guò)如Xvector、LSTM-GE2E等最先進(jìn)的頂級(jí)專(zhuān)家設(shè)計(jì)的聲紋模型,并且聲紋模型訓(xùn)練最高可達(dá)到90%的訓(xùn)練提速。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-12-26
平安科技自動(dòng)化機(jī)器學(xué)習(xí)平臺(tái)研究成果亮相國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議
近日,第二十六屆ICONIP國(guó)際神經(jīng)信息處理學(xué)術(shù)會(huì)議(The 26th International Conference on Neural Informati

長(zhǎng)按掃碼 閱讀全文