從百度大腦開放日談起:身邊的每件小事都可以與AI有關(guān)

中關(guān)村創(chuàng)業(yè)大街,這個(gè)曾見證互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮的著名地標(biāo),也曾陷入冷寂。

而今,”智能+“已經(jīng)成為時(shí)代新命題,這條大街又因AI有了新的活力。

去年12月底,百度大腦在中關(guān)村創(chuàng)業(yè)大街開設(shè)第一家“線下體驗(yàn)店“,引來人頭攢動。3月20日,首期百度大腦開放日在中關(guān)村創(chuàng)業(yè)大街舉辦,更多了一份熱鬧。

過去,在創(chuàng)業(yè)大街上生長起來的很多互聯(lián)網(wǎng)產(chǎn)品與技術(shù)已經(jīng)與我們的生活難以分割,如今AI到來,又會是一種什么景象?

在百度大腦開放日上,百度大腦帶來了24種全新開放的AI技術(shù),20個(gè)鮮活的落地案例,用滿滿的誠意與開發(fā)者一起展開對未來的想象。

用AI的熱度 去溫暖每個(gè)角落

整場開放日,最令人印象深刻的案例是“智能貓窩”,看到冬天里無家可歸的流浪貓,百度大腦工程師晚兮利用百度大腦的動物識別技術(shù)和百度EasyDL,打造出了配備“貓臉門禁”、“病貓識別”、“絕育識別”三大黑科技的貓窩,不僅可以識別174種不同品種的貓咪,還可以識別貓口炎、貓鼻支、貓皮膚病、貓外傷4種常見貓病,發(fā)現(xiàn)未絕育的貓,幫助志愿者及時(shí)救助。

和流浪貓一樣,垃圾分類也是一大社會難題。分形科技借助百度EasyDL的圖像分類技術(shù),打造了首款智能垃圾桶,可以對7種常見垃圾自動分類;

德邦物流為了讓用戶免去自行填寫信息的麻煩,使用百度大腦的定制詞法分析快遞申請,一秒拆分姓名、電話、住址等信息;

看到審批窗口總是排滿長隊(duì),科鴻智信利用OCR 、iOCR及EasyDL平臺開發(fā)了智能化審批管理系統(tǒng),建立起“一次都不跑、隨時(shí)隨地辦”的便民服務(wù)新模式。

嫌棄鼠標(biāo)的功能太雞肋,有開發(fā)者集成百度的語音識別和合成技術(shù)、翻譯技術(shù) ,打造了智能語音鼠標(biāo),語音輸入速度可以達(dá)到每分鐘400字,比傳統(tǒng)鍵盤輸入提升了兩倍,并且支持28種語言的翻譯;

還有開發(fā)者為了方便控制跑步機(jī),使用百度大腦的語音識別和UNIT技術(shù),開發(fā)了可語音控制的跑步機(jī),動動嘴就可以切歌、速度控制、模式變換等,據(jù)說月銷量已經(jīng)高達(dá)一萬臺以上。

以上這些在開放日展出的案例,只是百度大腦落地案例冰山一角。2018年百度大腦在6個(gè)城市舉辦了7場行業(yè)創(chuàng)新論壇,針對企業(yè)服務(wù)、信息服務(wù)、地產(chǎn)物業(yè)、智能零售、智能工廠、智能校園、智能政務(wù)推出了7大行業(yè)解決方案,AI能力已然滲透進(jìn)產(chǎn)業(yè)的毛細(xì)血管,從而影響我們生活的方方面面。

正如百度AI技術(shù)生態(tài)部總經(jīng)理喻友平在現(xiàn)場所說,“人工智能應(yīng)用的領(lǐng)域可以說無處不在,只要企業(yè)、開發(fā)者、合作伙伴們能有發(fā)現(xiàn)問題的眼睛,就有創(chuàng)新創(chuàng)業(yè)的機(jī)會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實(shí)現(xiàn)各自領(lǐng)域的業(yè)務(wù)解決方案,創(chuàng)造全新商業(yè)模式,帶來更多機(jī)遇。”

研發(fā)不是炫技 是對技術(shù)賦能的踐行

作為百度在人工智能領(lǐng)域多年研究的集大成,百度大腦在2016年正式開放后,已經(jīng)開放了語音技術(shù)、視覺技術(shù)、自然語言處理、知識圖譜、機(jī)器學(xué)習(xí)等近160項(xiàng)通用AI能力,有著超過100萬的開發(fā)者,已然成為服務(wù)規(guī)模最大的AI開放平臺。

對于百度大腦而言,技術(shù)的創(chuàng)新并沒有盡頭,就像是一場“打怪升級”的游戲,一直追求的是怎么讓技術(shù)更好用,怎么將效率再提高一些,最終實(shí)現(xiàn)“用AI讓復(fù)雜的世界更簡單”。

在百度大腦開放日當(dāng)天,百度AI技術(shù)生態(tài)部總經(jīng)理喻友平一口氣介紹了新開放的24項(xiàng)AI技術(shù)能力,囊括視覺、自然語言和語音。以往開發(fā)者要苦苦研發(fā)上月的技術(shù),在百度大腦都可以一鍵獲取。開放一個(gè)全新的AI技術(shù),開發(fā)者就可能創(chuàng)造出一個(gè)全新的AI應(yīng)用,實(shí)實(shí)在在改變生活。

在視覺方向上,OCR、車輛分析、人臉識別、圖像識別都有數(shù)項(xiàng)更新。百度的OCR全系列產(chǎn)品多達(dá)34種,覆蓋了卡證、票據(jù)、文檔、汽車等場景。

如果你是一名戶籍系統(tǒng)相關(guān)的開發(fā)者,只需要對著戶口本拍一張照片,系統(tǒng)就能字段進(jìn)行結(jié)構(gòu)化識別,然后反饋出信息頁的出生地、出生日期、姓名、民族、與戶主關(guān)系、性別、身份證號碼,將會幫助相關(guān)工作人員減輕大半的工作量。目前,百度在OCR上的能力最為全面,對于開發(fā)者來說,在同一家平臺上就能找到應(yīng)用場景的對應(yīng)技術(shù),十分便捷。

如果你是一位交警或者停車場管理員,一定會對百度大腦的車輛分析技術(shù)點(diǎn)贊。百度大腦推出了車輛檢測、車流統(tǒng)計(jì)、車輛屬性分析、外觀損傷識別等服務(wù)。其中車輛檢測功能,可以通過識別圖像中的所有機(jī)動車輛(包含小汽車、卡車、巴士、摩托車、三輪車),反饋每輛車的類型和坐標(biāo)位置,并對每類車輛分別計(jì)數(shù)。

如果你是一名自拍愛好者,百度大腦顯然知道你想要的是什么。百度大腦新增了人臉情緒識別,并升級了人臉關(guān)鍵點(diǎn)檢測和手勢識別,人臉檢測關(guān)鍵點(diǎn)由72個(gè)增至150個(gè),常見手勢能識別也達(dá)到了24種。這些技術(shù)落地之后,人臉識別不再局限在解鎖和美顏,將帶來更多有趣的應(yīng)用:錄制短視頻時(shí)有更豐富的手勢特效,識別你的情緒自動匹配背景音樂等等。

語音和語義識別也是百度大腦升級的重點(diǎn),包括語言處理應(yīng)用平臺、語言處理應(yīng)用技術(shù)、語言處理基礎(chǔ)技術(shù)、知識理解以及知識圖譜。

在百度大腦開放日上,令人印象深刻的演示是三個(gè)有趣的應(yīng)用:

一是新聞?wù)瑢π侣剝?nèi)容進(jìn)行全面的語義理解與分析,然后自動抽取新聞文本中的關(guān)鍵信息并按指定長度生成摘要,可以應(yīng)用于熱點(diǎn)新聞聚合、新聞推薦、語音播報(bào)、彈窗推送等場景,幾乎是所有新聞工作者的福音。

二是智能寫詩,用戶只需要輸入任意主題詞(如公司名、節(jié)氣名),百度大腦便可自動生成融合了該主題詞的詩詞。實(shí)際測試顯示,百度大腦的智能寫詩在語義和語境上并沒有明顯的違和感,不失為娛樂化營銷的又一重要工具。

三是智能春聯(lián),今年的央視春晚上,主持人高博就演示了智能春聯(lián)“看臉”的絕活兒,通過“刷臉”生成專屬春聯(lián)。如今這項(xiàng)技能也被百度開放出來,何嘗不是人工智能融入美好生活的一個(gè)典型案例呢。

在語音方面,百度首次對外開放了搭載國際領(lǐng)先的注意力(attention)模型的語音能力,擁有更快的響應(yīng)速度,相對識別準(zhǔn)確度提升15%。同時(shí)中英文混雜和純英文自由說,既能識別方言又能識別普通話,那些曾經(jīng)讓用戶和開發(fā)者頭疼的問題,在這里被一次性解決。

不止如此,百度還即將上線很多新產(chǎn)品:零代碼自助訓(xùn)練語音識別模型,可以幫助開發(fā)者提升業(yè)務(wù)場景下的識別準(zhǔn)確率;而遠(yuǎn)場語音開發(fā)套件,則可以應(yīng)用于機(jī)器人、兒童故事機(jī)、家電、車載設(shè)備等硬件,語音識別將無處不在。

在喻友平看來,百度大腦的開放生態(tài)有著以下優(yōu)勢:一個(gè)是技術(shù)領(lǐng)先,百度很早就成立了深度學(xué)習(xí)研究院,并且早在16年開源了國內(nèi)第一個(gè)深度學(xué)習(xí)框架paddlepaddle,在各類國際比賽上也取得過非常多的獎(jiǎng)項(xiàng),并且聯(lián)合舉辦了像上面介紹的國際權(quán)威競賽,在這樣的技術(shù)號召力下,聚集了非常多的人才,這是技術(shù)得以持續(xù)保持領(lǐng)先的基礎(chǔ);

一個(gè)是技術(shù)布局非常全面,從感知到認(rèn)知,從語音到視覺到語義到AR等等,非常全面,可以幫助大家一站式的獲得服務(wù),提高集成效率;最后,我們以可落地為目標(biāo),在降低人工智能應(yīng)用門檻的這個(gè)方向上持續(xù)不斷的努力,所以雖然只開放了兩年多的時(shí)間,但進(jìn)化速度也非常快。

“我們可以看到整個(gè)平臺的架構(gòu),從模型到軟硬一體,從深度學(xué)習(xí)框架到解決方案,從云服務(wù)到多種輸出方式的支持,各個(gè)層面都快速豐富起來。我們也非常重視各個(gè)企業(yè)和開發(fā)者提出的需求,并且特別感謝在這個(gè)進(jìn)化過程中大家的包容與支持?!?/p>

藝術(shù)家們喜歡讓人們從作品中了解自己,如同在蒙娜麗莎中思考達(dá)芬奇,在第九交響曲中聽懂貝多芬。

百度大腦似乎有著同樣的情愫:用開放生態(tài),為開發(fā)者提供發(fā)揮想象力的“黑土地”,讓AI走向社會的每一個(gè)角落。

喻友平談到,人工智能應(yīng)用的領(lǐng)域可以說無處不在,只要企業(yè)、開發(fā)者、合作伙伴們能有發(fā)現(xiàn)問題的眼睛,就有創(chuàng)新創(chuàng)業(yè)的機(jī)會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實(shí)現(xiàn)各自領(lǐng)域的業(yè)務(wù)解決方案,創(chuàng)造全新商業(yè)模式,帶來更多機(jī)遇。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-22
從百度大腦開放日談起:身邊的每件小事都可以與AI有關(guān)
而今,”智能+“已經(jīng)成為時(shí)代新命題,這條大街又因AI有了新的活力。去年12月底,百度大腦在中關(guān)村創(chuàng)業(yè)大街開設(shè)第一家“線下體驗(yàn)店“,引來人頭攢動。

長按掃碼 閱讀全文