對AI開發(fā)還不熟?試試這個開源AI模型生產(chǎn)平臺,秒成專家級水平

  近日,由云天勵飛首席科學(xué)家王孝宇博士等多位國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺YMIR正式發(fā)布。

  什么是 YMIR?

  YMIR(挖米匠),是一個數(shù)據(jù)驅(qū)動的開源算法訓(xùn)練平臺,能夠做到以無代碼開發(fā)的方式,實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型驗證等功能。YMIR遵從Apache 2.0 許可協(xié)議,商用及個人使用均免費。

  YMIR是由國際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺。發(fā)起成員包括:前Snap計算機視覺主 席,云天勵飛首席科學(xué)家王孝宇;美國硅谷NEC 實驗室媒體分析部主管、UCSD教授,印裔科學(xué)家Manmohan Chandraker;前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學(xué)家William Brendel等。

云天勵飛首席科學(xué)家 王孝宇

美國硅谷NEC 實驗室媒體分析部主管、UCSD教授 Manmohan Chandraker

  前谷歌、亞馬遜、Snap機器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官 William Brendel

  YMIR 的五大特點?

  YMIR是一個高度自動化的AI模型開發(fā)產(chǎn)品。其將模型開發(fā)行為抽象為數(shù)據(jù)收集、模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注等基本操作,并形成標(biāo)準(zhǔn)流程,提供一站式服務(wù)。實際使用時以圖形化的交互界面完成數(shù)據(jù)與模型不斷更新迭代的完整流程。由此,YMIR極大降低了AI模型研發(fā)的技能要求,不再要求從業(yè)者具備專業(yè)的AI技能。只要對系統(tǒng)操作員加以數(shù)據(jù)集、模型訓(xùn)練、模型迭代等概念知識的少量培訓(xùn),其便具備模型開發(fā)的能力,因而對人工智能向各行各業(yè)的普及具備重大意義。

  針對具備一定專業(yè)能力的算法開發(fā)人員,YMIR平臺提供開放API,使用者可籍此將自己開發(fā)的模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、模型診斷等工具對接YMIR開放接口實現(xiàn)端到端的一站式模型開發(fā)。

  YMIR 主要以數(shù)據(jù)為中心,集成了數(shù)據(jù)和模型版本控制,同時引入工作空間等概念,實現(xiàn)多個模型開發(fā)任務(wù)的并行快速迭代,為模型的大規(guī)模批量生產(chǎn)提供平臺性支持。

  YMIRV1.0新增模型生產(chǎn)項目管理

  1、傻瓜式迭代操作流程(保姆式模型開發(fā)流程指引)

  YMIR 新版本與上一版本相比,引入項目管理式的工作流程,使AI模型的生產(chǎn)進一步標(biāo)準(zhǔn)化。與老版本相比,模型生產(chǎn)操作員上手時間大幅縮短,并通過標(biāo)準(zhǔn)化的生產(chǎn)方式實現(xiàn)AI模型品控。

  在以項目管理為理念的研發(fā)制式下,模型研發(fā)項目被切分為幾個關(guān)鍵模塊。每個模塊對應(yīng)一個任務(wù),這些任務(wù)具備前后依賴關(guān)系形成研發(fā)流程。只有流程前方任務(wù)完成后,流程后方任務(wù)才能被啟動。如下圖所示,當(dāng)一個模型研發(fā)項目被創(chuàng)建后,即能看到頁面上方的任務(wù)迭代流程指引,清晰說明當(dāng)前步驟與下一步驟,僅需按照指引點擊鼠標(biāo)操作即可,操作對小白用戶十分友好、非常銀杏化。

  賬號登錄后即可見項目創(chuàng)建頁面

  項目創(chuàng)建成功后的頁面

  項目創(chuàng)建后的任務(wù)流程指引頁面

  2、數(shù)據(jù)集自動整理

  在AI模型開發(fā)的周期里,模型迭代占據(jù)90%以上的時間。而數(shù)據(jù)的迭代是模型迭代的關(guān)鍵部分,數(shù)據(jù)也是AI研發(fā)過程中最為重要的資產(chǎn),因此數(shù)據(jù)更新的追蹤和管理顯得尤為重要。能重現(xiàn)數(shù)據(jù)的更新過程,便能重復(fù)模型生產(chǎn)過程。

  YMIR新增數(shù)據(jù)集版本管理功能,能自動生成數(shù)據(jù)集版本并記錄每次對數(shù)據(jù)集的操作。一方面,與上一版本相比,使用者無需通過手動命名數(shù)據(jù)集對不同功能數(shù)據(jù)集進行區(qū)分,系統(tǒng)會自動進行數(shù)據(jù)整理,歸入訓(xùn)練集、挖掘集、測試集等,并對這些數(shù)據(jù)集的更新進行版本控制。數(shù)據(jù)集和模型的一一對應(yīng)關(guān)系亦被記錄下來。此功能對有大量數(shù)據(jù)挖掘的模型研發(fā)十分友好,減少數(shù)據(jù)集版本的冗余,提高數(shù)據(jù)集管理效率。YMIR用戶再也不用對著上百個雷同的數(shù)據(jù)集無從下手。另一方面,模型的研發(fā)過程被完整的記錄下來,可輕易重新生產(chǎn)模型。傳統(tǒng)的算法研發(fā)人員工作交接涉及,數(shù)據(jù)集、模型、訓(xùn)練流程等多個復(fù)雜環(huán)節(jié)的交接,很難重復(fù)之前的工作。而在YMIR平臺上產(chǎn)生的研發(fā)過程,尤其是數(shù)據(jù)集的迭代均有完整追蹤,基本不需要交接流程,企業(yè)再也不用擔(dān)心員工突然的離職。

  數(shù)據(jù)集版本管理頁面(1)

  數(shù)據(jù)集版本管理頁面(2)

  模型迭代版本管理頁面

  YMIRV1.0無縫對接開放免費的標(biāo)注工具LabelFree

  數(shù)據(jù)標(biāo)注的質(zhì)量與效率直接影響模型訓(xùn)練的質(zhì)量與效率,一個好的標(biāo)注工具可以讓模型訓(xùn)練事半功倍。LabelFree是一個開放的、可私有化部署的高性能數(shù)據(jù)標(biāo)注系統(tǒng)。其操作簡單、數(shù)據(jù)可靠,為算法服務(wù)提供可靠的底層數(shù)據(jù)支撐。

  LabelFree項目管理頁面

  1.大幅提升標(biāo)注質(zhì)量

  LabelFree支持在數(shù)據(jù)標(biāo)注的早期階段對標(biāo)注質(zhì)量進行嚴格把控。其支持多角色用戶管理功能,當(dāng)角色為質(zhì)檢員時,可對標(biāo)注結(jié)果進行檢查與復(fù)核。

  2.大幅提升標(biāo)注效率

  LabelFree可大幅提升個人標(biāo)注效率。其支持大量標(biāo)注步驟快捷鍵操作,通過人機交互的優(yōu)化顯著提升標(biāo)注效率。

  快捷鍵使用說明

  LabelFree亦支持團隊標(biāo)注。其支持多人協(xié)作完成同一標(biāo)注任務(wù),并實現(xiàn)任務(wù)自動分發(fā)。

  同時,LabelFree提供一鍵標(biāo)注服務(wù),幫助需要的個人及企業(yè)用戶在最短的時間內(nèi)獲取質(zhì)量可靠的標(biāo)注數(shù)據(jù)。

  3、可靠的數(shù)據(jù)安全管理

  數(shù)據(jù)的完全私有化管理,最大程度的保護數(shù)據(jù)安全。數(shù)據(jù)集管理服務(wù)依托具有彈性伸縮能力的原生對象存儲,為機器學(xué)習(xí)、大數(shù)據(jù)分析平臺提供高性能、高可用的數(shù)據(jù)基座。

  4、完全的免費開放平臺

  LabelFree平臺對數(shù)據(jù)集大小、用戶數(shù)量、項目數(shù)量等功能均無限制,用戶可在平臺上進行各種自定義的數(shù)據(jù)標(biāo)注任務(wù)并獲得良好的體驗。

  重磅!挖米匠要開直播啦!手把手教大家使用 YMIR,小白也能成為算法工程師!

  歡迎大家試用新版本,接受所有吐槽哦~?部署或試用過程中有任何問題都歡迎聯(lián)系小助手“挖米匠”。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )