賦能AI測試 Testin云測與英特爾合作,將OCR模型推理效率提升6倍

談起OCR(光學(xué)字符識別,Optical Character Recognition)應(yīng)用,很多人并不陌生,其最常見的應(yīng)用場景就是實現(xiàn)“圖片轉(zhuǎn)換成文字”,并廣泛應(yīng)用于如掃描名片并加入通訊錄、拍攝英文菜單并將其翻譯成中文等需求之中。經(jīng)歷長期的發(fā)展之后,OCR應(yīng)用的準確率、速度都有了顯著提升,實用性也越來越高。

雖然當前的OCR應(yīng)用已經(jīng)能夠應(yīng)對大多數(shù)消費類的場景,但是在商業(yè)化應(yīng)用場景中,OCR 的識別效率仍存在廣泛的提速需求。在AI技術(shù)引領(lǐng)的下一代測試中,北京云測信息技術(shù)有限公司*(以下簡稱:Testin云測)發(fā)布全新AI測試產(chǎn)品iTestin,全面提升測試產(chǎn)品的易用性和自動化效率,在提升腳本編寫效率一倍的同時,將腳本的維護成本降低了一倍。其使用了 OCR 深度學(xué)習(xí)方案來支持控件定位的輸入,OCR 識別速度越快,就越有助于自動化速度測試的提升。為此,Testin云測基于英特爾® 至強® 可擴展處理器、英特爾® OpenVINO™ 工具套件對 OCR 深度學(xué)習(xí)方案進行優(yōu)化,將AI測試中的OCR識別時間從2秒降低到0.3秒左右,實現(xiàn)了6倍的性能提升,且不影響測試的效果和結(jié)果。

當AI測試遇上OCR,開啟下一代測試

要開發(fā)出一款軟件應(yīng)用并將其投入到實際運營中,并不是很多人想象中的那樣,找一些程序員寫一些代碼就能簡單完成的事情,而是涉及到一套完整、復(fù)雜的流程。很多開發(fā)者甚至認為,測試是開發(fā)過程中最繁瑣的環(huán)節(jié)之一。在軟件完成初步開發(fā)之后,開發(fā)人員需要測試其功能是否可用、在不同型號的設(shè)備(如基于安卓系統(tǒng)的設(shè)備與基于iOS系統(tǒng)的設(shè)備)上有什么應(yīng)用問題。此外,不同的軟件在各區(qū)域?qū)嶋H網(wǎng)絡(luò)環(huán)境中的表現(xiàn)也可能會有差異,這些都需要進行詳盡的測試。

為了幫助開發(fā)者對軟件進行測試,Testin云測全球首創(chuàng)了云測試的模式,并在此基礎(chǔ)上,推出了融合AI技術(shù)的下一代測試產(chǎn)品iTestin。開發(fā)者可以將軟件上傳到該平臺進行自動化測試,Testin云測會詳盡列出測試環(huán)節(jié)中的所有參數(shù),并會提供自動輸出錯誤、報警等測試日志服務(wù),出具專業(yè)化測試報告,以幫助開發(fā)者快速定位可能出現(xiàn)的問題,對軟件進行持續(xù)優(yōu)化?! ?/p>

賦能AI測試 Testin云測與英特爾合作,將OCR模型推理效率提升6倍

在AI測試過程中,Testin云測發(fā)現(xiàn),自動化框架本身提供的控件輸入不穩(wěn)定。因此,Testin云測的AI測試方案傾向于使用更穩(wěn)定的手機截屏,做為控件定位的輸入,這就要求使用 OCR 技術(shù)來定位和解析屏幕截圖中的文本。由于 OCR 的效率與準確度會對測試的效果與結(jié)果帶來不可忽視的影響,而模板匹配、特征提取等傳統(tǒng) OCR 方案又暴露出對于圖像清晰度要求高、抗背景干擾能力較差等缺陷,所以Testin云測決定使用深度學(xué)習(xí)方案來提升文本推理能力。

為了提升 OCR 深度學(xué)習(xí)的效率,Testin云測與英特爾進行了深度合作,從軟件加速以及硬件兩個角度對于 OCR 方案進行優(yōu)化。

至強+OpenVINO™ 將 OCR 效率提升6倍

在很多情況下,OCR 深度學(xué)習(xí)方案使用的都是 GPU,通過其強大的并行計算能力來提升文本推理能力。但是,GPU 方案也存在很多缺陷。特別是在較小規(guī)模、私有云用戶的深度學(xué)習(xí)應(yīng)用中,搭建專用于 OCR 深度學(xué)習(xí)的 GPU 平臺需要客戶同時升級硬件平臺,這樣不僅耗費時間成本,而且也會帶來相應(yīng)的硬件升級成本,更多用戶希望在現(xiàn)有的基礎(chǔ)設(shè)施平臺上運行深度學(xué)習(xí)負載。而且,在大量推理負載中,基于 CPU 的推理性能并不弱于 GPU 平臺,這也成為Testin云測進行方案驗證的重要動力。

在基礎(chǔ)設(shè)施平臺的搭建上,Testin云測最終選擇了英特爾® 至強® 金牌 6140處理器,該處理器是英特爾® 至強® 可擴展處理器家族產(chǎn)品,不僅擁有強大的通用計算能力,還集成了增強單指令多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)、英特爾® AVX-512等創(chuàng)新技術(shù),實現(xiàn)了對于通用計算能力和并行計算能力的兼顧,為深度學(xué)習(xí)訓(xùn)練提供了卓越的性能基礎(chǔ)。相比上一代產(chǎn)品,英特爾® 至強® 可擴展處理器針對深度學(xué)習(xí)訓(xùn)練和推理可提供高達2.2倍的性能。結(jié)合可加快交付人工智能服務(wù)的軟件優(yōu)化,相比3年前未經(jīng)優(yōu)化的服務(wù)器系統(tǒng),全新的處理器可實現(xiàn)113倍的深度學(xué)習(xí)性能提升。

在軟件與算法層面上,Testin云測對深度學(xué)習(xí)框架、加速方案也進行探索和選擇。為了加速 OCR 方案,Testin云測在初期使用的深度學(xué)習(xí)框架是Google* 開發(fā)的TensorFlow*,TensorFlow將深度學(xué)習(xí)復(fù)雜的計算過程抽象成數(shù)據(jù)流圖,在深度學(xué)習(xí)中有著廣泛的應(yīng)用。但是,Testin云測發(fā)現(xiàn),無論是公開版本的 TensorFlow,還是優(yōu)化版本的 TensorFlow,在速度上都無法滿足需求。因此,Testin云測希望能夠找到一種全新的加速方案。

在英特爾的建議下,Testin云測嘗試使用英特爾® OpenVINO™ 工具套件分發(fā)版來進行加速。該工具套件支持開發(fā)人員使用行業(yè)標準人工智能框架、標準或自定義層,將深度學(xué)習(xí)推理輕松集成到應(yīng)用中,開發(fā)人員只需編寫一次代碼,即可將其快速、無縫地部署在當前和未來的英特爾硬件上,從而消除應(yīng)用重復(fù)開發(fā)問題。該工具套件基于卷積神經(jīng)網(wǎng)絡(luò) (CNN),可在英特爾硬件中擴展工作負載。

OpenVINO™ 的采用帶來了立竿見影的效果,Testin云測針對公共 TensorFlow 與英特爾® OpenVINO™ 實現(xiàn)的推理吞吐量進行了測試,并發(fā)現(xiàn),基于公共 TensorFlow 的解決方案的推理吞吐量為 23.26 (FPS) ,基于英特爾® OpenVINO™ 的解決方案的推理吞吐量為 151.29 (FPS) ,后者比前者的吞吐量提升650%左右(對比結(jié)果如圖1),而且基本沒有精度損失。  

賦能AI測試 Testin云測與英特爾合作,將OCR模型推理效率提升6倍

此外,Testin云測還基于第二代英特爾® 至強® 可擴展處理器進行了測試,該處理器集成了英特爾® 深度學(xué)習(xí)加速(英特爾® Deep Learning Boost)技術(shù)、DL Boost(VNNI)技術(shù),以加速數(shù)據(jù)中心、企業(yè)和智能邊緣計算環(huán)境中的人工智能推理工作負載。特別是在搭配支持低精度的INT8加速的 OpenVINO™ 新版本之后,有望將推理速度在提升3倍左右。

以AI賦能測試服務(wù)

目前,Testin云測的業(yè)務(wù)范疇,不僅包括測試服務(wù),還包括安全、推廣,以及AI數(shù)據(jù)標注等服務(wù)。通過開發(fā)基于人工智能 (AI)、深度學(xué)習(xí)技術(shù)的數(shù)據(jù)標注、OCR 識別等相關(guān)AI測試工具,Testin云測可以幫助企業(yè)客戶完成自動化應(yīng)用測試,大幅降低勞動密集度。

通過將 AI 與自動化測試解決方案結(jié)合,能夠有助于自動化、全路徑探索應(yīng)用的各種顯在或是潛在問題,提取特征訓(xùn)練進行業(yè)務(wù)功能的識別,并智能生成測試報告。AI 的加入還有助于實現(xiàn)對功能模塊的自動探索,并實現(xiàn)執(zhí)行過程的可視化,使得測試環(huán)節(jié)定位更加迅速準確。對于用戶來說,自動化的測試管理和測試用例創(chuàng)建能夠顯著降低測試時間與資源的浪費,加快應(yīng)用上市進程。

Testin云測的測試實例證明,英特爾® 至強® 可擴展處理器+英特爾® OpenVINO™ 的融合解決方案有助于在具體應(yīng)用場景中加快推理的速度。而且,該解決方案還展現(xiàn)了其它自動化測試場景的應(yīng)用潛力,為用戶搭建基礎(chǔ)平臺提供了重要的方案選擇。(來源:ChinaIT.com)

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-11-22
賦能AI測試 Testin云測與英特爾合作,將OCR模型推理效率提升6倍
談起OCR(光學(xué)字符識別,Optical Character Recognition)應(yīng)用,很多人并不陌生,其最常見的應(yīng)用場景就是實現(xiàn)“圖片轉(zhuǎn)換成文

長按掃碼 閱讀全文