走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

?在AI技術(shù)逐漸滲透產(chǎn)業(yè)發(fā)展、落地的過程中,開發(fā)者可謂是最重要的一環(huán)。3月20日,首場百度大腦開放日在北京中關(guān)村創(chuàng)業(yè)大街百度大腦創(chuàng)新體驗中心舉行,此次活動旨在為AI開發(fā)者提供及時、全面、近距離的了解百度大腦最新AI產(chǎn)品和案例,幫助更多開發(fā)者探索AI前沿應用,并且能與百度AI技術(shù)大拿們進行深度、持續(xù)的交流。

活動當天,百度AI技術(shù)生態(tài)部總經(jīng)理喻友平,就百度大腦平臺與生態(tài)進行了全面的詳解,同時展示了百度大腦開放平臺Q1核心升級內(nèi)容,包括語音技術(shù)、視覺技術(shù)、自然語言處理、知識圖譜等通用AI能力的新近推出,以及開源深度學習框架方面的優(yōu)化升級,更有多個應用場景案例與大家分享,可謂干貨滿滿,廣受前來參加活動的開發(fā)者與媒體們歡迎與稱贊。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

PaddlePaddle:用深度學習賦能智能+的方方面面

1.業(yè)界首個視頻分類模型庫:新增視頻模型庫,提供5個視頻分類經(jīng)典模型以及適合視頻分類任務的通用骨架代碼,用戶可一鍵式高效配置模型完成訓練和評測。視頻理解權(quán)威競賽ActivityNet - Kinetics視頻動作識別任務冠軍方法stNet的resnet50版本開源實現(xiàn)。

2.基于PaddlePaddle的BERT多機多卡和混合精度訓練。新增支持NLP語義表示BERT模型,支持多機多卡訓練,支持混合精度訓練,訓練速度對比主流實現(xiàn)提升50%+,提供完整部署示例。

3.分布式訓練性能大幅提升:大規(guī)模稀疏參數(shù)服務器Benchmark發(fā)布,CPU多機異步訓練發(fā)布顯著提升點擊率預估任務IO吞吐的built-in reader,多機多卡訓練性能多方面提升。

并推出業(yè)界領(lǐng)先的深度強化學習框架PARL1.0。據(jù)喻友平介紹,PARL曾在NeurIPS 2018 奪冠。具有高靈活性和可擴展性,支持可定制的并行擴展,覆蓋DQN、DDPG、PPO、A3C等主流強化學習算法。通過8塊GPU拉動近20000個CPU節(jié)點運算,將近5個小時迭代一輪的PPO算法加速到不到1分鐘。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

如今,百度PaddlePaddle已經(jīng)廣泛應用于農(nóng)業(yè)、林業(yè)、工業(yè)、零售、人力、制造、石油、通訊、地產(chǎn)、汽車等多個行業(yè)領(lǐng)域,與合作伙伴一起幫助越來越多的行業(yè)完成向“智能+”的升級轉(zhuǎn)變。

語音方向:首次開放搭載國際領(lǐng)先的SMLTA模型的語音能力:語音識別極速版

根據(jù)喻友平介紹,目前百度大腦語音開放能力包括語音喚醒、語音識別、語音合成等通用能力,還包括即將推出的語音識別自訓練平臺、軟硬一體的語音開發(fā)套件以及各種場景方案。

1月的百度輸入法探索版發(fā)布會上,首次發(fā)布了領(lǐng)先國際的語音技術(shù):在線語音領(lǐng)域全球首創(chuàng)的流式多級截斷注意力模型SMLT「Streaming trancated multi-layer attention」。在百度輸入法產(chǎn)品發(fā)布后,驚艷的語音輸入體驗得到了業(yè)界的一致好評。2個月后,百度大腦語音方向首次對外開放采用這一語音技術(shù)的語音能力:語音識別極速版。擁有更快的響應速度,相對識別準確度提升15%,為開發(fā)者帶來更極致的識別體驗。

此項語音能力在API調(diào)用方式下,實時率小于0.1,意味著5s的音頻不到500ms即可完成識別過程,極大減少了識別音頻所需的耗時,提升了語音交互的響應體驗。在近距離安靜環(huán)境下,識別準確率可達到98%,同時支持略帶口音、童聲、耳語的識別,使語音識別應用更加廣泛。多平臺的SDK也即將推出,使APP、服務器端更可實時識別,應用這一領(lǐng)先技術(shù)。目前,每個開發(fā)者賬戶將贈送5W次免費調(diào)用量,針對新能力的使用者,也即將推出一系列贈送及優(yōu)惠活動。

同時,近場語音識別升級了預置語義解析。預置場景由35個升級為51個,包括天氣、航班、電話、電影播放、頁面屏幕控制、電視劇、美食、手機設置、通用錄、提醒、短信、故事等,語義解析效果全面優(yōu)化,80%優(yōu)于原有解析結(jié)果。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

不僅如此,還有一些新品即將上線。如:語音識別自訓練平臺,支持自動評估選出最好的基線模型,僅上傳業(yè)務場景文本語料即可訓練語言模型,零代碼自助訓練專屬的語音識別模型,極大地方便語音開發(fā)者提升所在業(yè)務場景的識別準確率,滿足業(yè)務上的語音識別需求。另外,遠場語音開發(fā)套件也即將上架售賣,可快速進行遠場識別開發(fā)評估,此套件應用于機器人、兒童故事機、家電、車載設備等硬件。同時還將開放離線合成,以及推出更多音庫。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

視覺方向:從車到人再到“證” 用AI都能看得清

在百度大腦開放日,喻友平還介紹了視覺方向更新升級的四方面內(nèi)容,包括OCR、車輛分析、人臉人體以及圖像識別。

首先,在極大便捷工作的OCR方面:1.新增了卡證OCR 4個新能力:戶口本OCR、出生醫(yī)學證明OCR、港澳通行證OCR、臺灣通行證OCR,總數(shù)達到9種;

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

新增票據(jù)OCR 4個新能力:行程單OCR、保單識別OCR、通用機打發(fā)票O(jiān)CR,定額發(fā)票O(jiān)CR,總數(shù)達到9種;

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

汽車場景3個新能力:車輛VIN OCR、機動車銷售發(fā)票O(jiān)CR、車輛合格證OCR,總數(shù)達到6種。這些OCR新能力在關(guān)鍵字段的準確率均在90%以上,并有多項是業(yè)界首次平臺化開放。至此,OCR產(chǎn)品全系列共34款,實現(xiàn)卡證、票據(jù)、文檔、汽車全場景覆蓋。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

同時,對已有的OCR能力也進行了功能升級:表格識別:支持合并單元格、無表格線等復雜樣式;iOCR 自定義模版文字識別:支持列寬不固定、有合并單元格的表格樣式的定制識別;駕駛證識別:支持駕駛證副頁的識別。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

其次,在車輛分析方面,推出全新系列服務:包括車輛檢測、車流統(tǒng)計、車輛屬性分析和外觀損傷識別。其中,車輛檢測,通過識別圖像中的所有機動車輛(包含小汽車、卡車、巴士、摩托車、三輪車),返回每輛車的類型和坐標位置,并對每類車輛分別計數(shù),可應用于違章停車監(jiān)測和智能停車場。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

  (車輛檢測)

車流統(tǒng)計,則根據(jù)視頻抓拍圖片序列,進行車輛檢測和追蹤,識別各類車輛(包括小汽車、卡車、巴士、摩托車、三輪車)在指定區(qū)域內(nèi)的駛?cè)?駛出情況,實現(xiàn)動態(tài)車流統(tǒng)計,可應用于實時監(jiān)控交通道路、卡口的車流量,自動統(tǒng)計不同時段各類車輛的進出數(shù)量,分析路口、路段的交通狀況,為交通調(diào)度、路況優(yōu)化提供精準參考依據(jù)。而車輛屬性分析和外觀損傷識別兩項服務,也即將開放,盡請期待。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

(車輛屬性識別)

在人臉人體識別方面,新發(fā)布了情緒識別,可以準確識別7類情緒:生氣、害怕、厭惡、高興、悲傷、驚訝、無情緒。此項技術(shù)可應用于幼兒園安全監(jiān)控等場景,通過監(jiān)控孩子的心理狀態(tài),判斷教師和幼兒是否有異常狀況,從而保障幼兒安全、及時預警并參與輔導等。同時人臉融合以及手部關(guān)鍵點將在3月推出。此外還有2項功能全新升級,包括:人臉檢測快速檢測人臉并返回人臉框位置、定位五官與輪廓關(guān)鍵點數(shù)量,從72個增加至150個;新增2種手勢,共24種常見手勢,整體識別率在90%以上,使得手勢識別更豐富、更準確;而即將上線的更高進精度的人像分割,可應用于人像美圖、影視后期等場景。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

而在圖像識別方面,新增紅酒識別和地標識別這2個新能力。通過紅酒識別,用戶只需要對著紅酒標簽拍照,系統(tǒng)就能自動識別紅酒的品牌和名稱,目前可識別數(shù)十萬種國內(nèi)外紅酒,識別準確率98%以上,從法國波爾多到中國張裕,商品信息都能得到準確關(guān)聯(lián),可以輕松為用戶提供參考和商品推薦。而地標識別則能夠精準識別約5萬中外著名地標、景點,準確率高達94%以上。用戶只需要拍攝包含國內(nèi)外著名景點、地標的照片,系統(tǒng)就能自動生成足跡、圖文博客等有意思的交互內(nèi)容,提升用戶旅游體驗。

同時,開放日現(xiàn)場還宣布,百度大腦即將上線邀測錢幣識別功能。該功能可以精準識別中外錢幣,支持數(shù)百類幣種、數(shù)千種面額,識別準確率98%以上,不僅能夠提升金融機構(gòu)貨幣兌換的效率,也能讓“外幣騙局”無處藏身。

從紅酒到地標再到錢幣,目前百度大腦的圖像識別種類已經(jīng)多達11種。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

語言及知識:能為你寫詩,還能讀懂你的情緒

百度大腦語言及知識方向能力集,共包括語言處理應用平臺、語言處理應用技術(shù)、語言處理基礎技術(shù)、知識理解以及知識圖譜。而此次開放日的更新亮點是,語言處理應用技術(shù)、知識理解以及智能寫作平臺。

在語言處理應用技術(shù)方面,推出新能力:1.文本糾錯,識別文本中有錯誤的片段,進行錯誤提示并給出正確的建議文本內(nèi)容;2.新聞摘要,對新聞內(nèi)容進行全面的語義理解與分析,自動抽取新聞文本中的關(guān)鍵信息并按指定長度生成摘要,可應用于熱點新聞聚合、新聞推薦、語音播報、APP消息Push等場景;3.智能寫詩,用戶只需要輸入任意主題詞(如公司名、節(jié)氣名),機器便可自動生成融合了該主題詞的詩詞;4.智能春聯(lián),用戶輸入任意主題詞(如自己的名字),機器可自動生成融合了該主題詞的春聯(lián),可以應用在企業(yè)互動營銷、APP春節(jié)互動活動; 5.對話情緒識別,可以針對一段對話文本,自動識別出當前會話者所表現(xiàn)出的情緒類別;

在知識理解方面,則推新能力:1.作文檢索,有數(shù)萬篇作文范文,可支持按文體、字數(shù)、年級、常見主題等進行查詢檢索,可應用在少兒教育產(chǎn)品(如學習機)、圖書館等場景;2.知識問答,可提供娛樂、人物、教育、影視、綜藝、動漫、小說、文學作品等垂類的問答能力,以及日期歷法、年齡差、算數(shù)、時間時區(qū)差等推理計算能力,可應用于智能音箱、兒童故事機、泛娛樂產(chǎn)品等場景。

同時,不久后,智能寫作平臺也將上線,將從素材上為創(chuàng)作者提供工具、幫助找到靈感,提升創(chuàng)作者的寫作效率和產(chǎn)出質(zhì)量,降低寫作成本。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

在百度大腦首場開放日,除了有以上多項核心的技術(shù)更新、能力升級、新品推出外,百度大腦在AI市場正式上架4款硬件產(chǎn)品,感興趣的開發(fā)者都可以在 PC 端訪問百度 AI 市場進行選購。同時推出百度大腦新品體驗師計劃,希望可以在幫助開發(fā)者成長的同時,推動百度大腦的進化。

走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”

其實,百度大腦一直致力于構(gòu)建開放的技術(shù)生態(tài),已成其多年技術(shù)積累和業(yè)務實踐的集大成者。截至目前,百度大腦已經(jīng)開放了近160項AI能力,平臺上開發(fā)者數(shù)量超過100萬,開放能力覆蓋語音、視覺、自然語言處理、機器學習等全面AI技術(shù)。

此次開放日活動,百度大腦誠邀眾多開發(fā)者、技術(shù)媒體、行業(yè)KOL共同參與,了解體驗百度大腦AI技術(shù),共同探討AI在開發(fā)、落地應用過程中遇到的實際問題,一起助力AI發(fā)展加速度。其實,除了此次的開放日活動外,百度大腦還推出了“月度更新計劃”,每個月一次的產(chǎn)品與技術(shù)更新,旨在助力企業(yè)和個人開發(fā)者智能前行,緊跟社會需求,這足以讓廣大企業(yè)和開發(fā)者們對百度大腦充滿信心,對我國未來人工智能的發(fā)展充滿期待。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-20
走進百度大腦開放日 吸收最新AI技術(shù)“營養(yǎng)”
?在AI技術(shù)逐漸滲透產(chǎn)業(yè)發(fā)展、落地的過程中,開發(fā)者可謂是最重要的一環(huán)。

長按掃碼 閱讀全文