給學習視頻加上字幕需要多久?1小時?很可能30秒就夠了。
想把視頻字幕導出文字,還要一幀一幀記?一句話就行了。
你能想象這些操作依靠什么完成的嗎?大多數(shù)人可能想不到,以往一些需要專業(yè)編輯軟件耗時耗力才能實現(xiàn)的操作,今后在百度網(wǎng)盤里可以一鍵搞定了。不止如此,未來,通過百度網(wǎng)盤“云一朵”助理,找圖、摘要、翻譯,都能成為一句話的事。
維特斯根坦說,我語言的邊界就是我世界的邊界。如今,AI正在拓寬世界的邊界——借助人類的自然語言。
未來的個人智能助理
科幻電影《Her》中,描述了這樣一個場景:一位擁有迷人聲線的虛擬AI,接管了人們大部分的工作和娛樂,不僅解放了雙手,甚至連雙腳也解放了,真正實現(xiàn)了常態(tài)化居家辦公。
過去幾十年,科幻電影對AI的描述大多離不開一個詞匯——效率。其背后掩藏的是現(xiàn)實世界對未來生活的終極愿景:生產(chǎn)力工具解放人類。
幾乎可以確定,每一部科幻片虛擬出來的AI都是在替人類工作,《西部世界》里的服務機器人、《星際穿越》里的塔斯,比比皆是。它映射出現(xiàn)實世界對AI的想象,總是要圍繞它最基礎的功能——效率躍遷。
從蒸汽機到內燃機,從數(shù)據(jù)化到信息化,科技催生社會進步總是圍繞效率躍遷,而效率的躍遷背后,隱藏著的往往是時代下人們龐大且沒被滿足的需求。
chatGPT引發(fā)的這一輪AI浪潮,之所以能在短時間內就席卷全球,技術創(chuàng)新是一方面,更底層的原因其實是社會對生產(chǎn)力工具進化的極度渴望。
正如文初我們展示的那樣,生產(chǎn)力工具如今在AI的加持下已經(jīng)開始表現(xiàn)的更科幻,而未來百度網(wǎng)盤結合大模型的升級,也將滿足社會對生產(chǎn)力工具的很大渴望。
1 更復雜的文件理解
以往我們需要一份專業(yè)報告的總結,只能一頁一頁看,如果是外文報告可能還要用到翻譯工具,再或者還需要轉換文檔格式,上述操作需要我們在瀏覽器、閱讀器、word等多個軟件來回穿梭,不僅會頭暈眼花,可能還會忙中出錯。
好消息是,以后這些繁雜的工作可以在百度網(wǎng)盤一鍵完成了。
基于文心大模型,百度網(wǎng)盤將要實現(xiàn)的一個大功能,即文檔從「閱讀」到「理解」。你可以讓它給你寫一個文檔總結,無論外文還是中文,幫助你快速從雜亂的信息中梳理知識。
你也可以挑選某一段讓它給你翻譯,又快又好。
甚至就連格式轉換也能一句話搞定。
簡而言之,通過這個例子,我們可以感受到一些變化,過去存儲在網(wǎng)盤的文件就只是一個文件,而今天百度網(wǎng)盤能夠幫助用戶理解其中的知識。
2 更快的圖片&文檔搜索
升級后的百度網(wǎng)盤,帶來了更快的圖片和文件搜索。
相較于傳統(tǒng)的翻閱式查找,在新的百度網(wǎng)盤中可以一句話找到想要的照片或文件。比如“幫我找一下最近拍的美食照片”或者更復雜的“去年公司的團建聚餐照片”就可以了。
借助大模型的能力,百度網(wǎng)盤能夠理解和分析更復雜的語義,并借助圖像識別技術快速找到目標文件。
而且,這項技術還不止步于圖片和文件,視頻查找也是可以的。
比如在百度網(wǎng)盤里的視頻資料,上次學過的知識點想要復習一下,但又記不得是幾分幾秒?沒關系,可以直接提問某個知識點,百度網(wǎng)盤就會基于視頻內容提供相關的解答并給出視頻對應內容的位置,也可以直接定位跳轉到對應位置。
目前,百度網(wǎng)盤云一朵正在內測中,打開百度網(wǎng)盤PC客戶端(最新版)或網(wǎng)頁版,即刻預約體驗。
我們之前說過,某種技術的出現(xiàn),背后往往是當時人類需求的集中爆發(fā)。內燃機的發(fā)明,讓我們能去到更遠的地方,促進了貿(mào)易和文化的交流;而數(shù)據(jù)化、信息化相當于是輪子和發(fā)動機,讓知識跑的更遠。
而當數(shù)據(jù)膨脹到一定程度后,知識堆疊的冗余就讓獲取知識變得困難。真正想找到有價值的信息卻如大海撈針,這一問題在數(shù)字信息時代變得越來越嚴重。生產(chǎn)力工具的進化,其目標就是讓知識獲取變得更容易。
如何解決這個新時代的新問題,這是我們看到在AI時代可能帶來的變化。就好像在輪子和發(fā)動機的基礎上加入一個導航儀,讓所有的內容和數(shù)據(jù)為我所用,這就從信息化到知識化。
炸裂的B端智能化
這一次的AI浪潮不止惠及個人,也包含廣大的B端企業(yè)用戶,畢竟企業(yè)擁有更集中也更迫切的生產(chǎn)力需求。
chatGPT發(fā)布之后,諸如廣告行業(yè)已有多家公司宣布將裁撤一部分基礎的文案崗位,轉向AIGC;一些畫師也在使用Midjourney這類的軟件為其工作。
跳轉到網(wǎng)盤市場的企業(yè)用戶,實際上存在兩類剛需,一類是數(shù)據(jù)存儲和傳輸,一類是基于存儲和傳輸?shù)谋镜匾绘I化生成。
對于第一類,比較典型的就是很多企業(yè)會將文件、合同、發(fā)票、素材等放到網(wǎng)盤里,以作備份或者傳輸用。那么這一類需求的痛點就是,花在海量文件查找和歸類的時間,即辛苦又沒有價值。
基于文心大模型,未來,百度網(wǎng)盤升級后將在企業(yè)版中加入更智能的圖片分類功能,定制了多達57個更契合辦公用途的分類,例如企業(yè)票證、商務合同、設計素材等,實現(xiàn)更好的管理和更快的查詢。
同個人版一樣,百度網(wǎng)盤企業(yè)版也將基于文心大模型,帶來企業(yè)知識官。通過對話式交互幫助企業(yè)版用戶對文件內容進行總結、提煉、問答和進一步加工。
例如可以讓它頭腦風暴想10個小清新的飲品名稱、根據(jù)提綱完成一篇報告,或者潤色一下文字讓文章看起來更高級,百度網(wǎng)盤都能搞定。
針對第二類需求,升級后的百度網(wǎng)盤某種意義上真正幫助特定行業(yè)實現(xiàn)了效率躍遷。
比如攝影行業(yè),從客戶追蹤到售后服務一套流程下來,平均服務一個客戶需要15個員工花費35天。
百度網(wǎng)盤推出的即拍即選服務,為攝影行業(yè)實現(xiàn)了效率的極大改進。
拍完即上傳,并且借助一鍵AI修圖、自動套版、生成網(wǎng)盤鏈接等本地操作,將傳統(tǒng)攝影機構一張照片涉及拍照、初修、調色、導卡選片等13個環(huán)節(jié),平均參與人員15人,縮減到整個環(huán)節(jié)從5天到15分鐘,單客服務成本降低75%,效率提升超過30倍。
同樣,在電商行業(yè),百度網(wǎng)盤的智能多模態(tài)加工不僅針對?像精修,還能通過AI為圖?更換所需要的背景,通過智能扣圖然后匹配相應的場景制作新的商品圖。
類似這樣針對特定行業(yè)的AI技術,其實不止百度一家在做,Adobe、Midjourney甚至還有專門的AI模特公司,但本質上它們還是傳統(tǒng)的軟件,也就是原有鏈條的一個部分。
而百度網(wǎng)盤未來支持AI模特、營銷海報制作,就是在一鍵本地生成的基礎上減少鍵條,讓生產(chǎn)力得到最大化的提升。
再比如生命科學行業(yè),例如基因公司要將測序文件交付給醫(yī)院、學?;蚩蒲袡C構,數(shù)據(jù)往往高達幾百GB甚至1TB,百度網(wǎng)盤提供的文件交付解決方案支持TB級別的數(shù)據(jù)傳輸,能夠幫助客戶將超大文件既便捷又安全的完成交付。
網(wǎng)盤,技術推動信息化到知識化
過去十年,網(wǎng)盤行業(yè)經(jīng)歷了兩個階段。其一是數(shù)據(jù)化,人們習慣將本地文件上傳到云端,實現(xiàn)本地資源的釋放和分享;其二是信息化,沉淀在網(wǎng)盤的海量數(shù)據(jù),催生了個人、企業(yè)乃至行業(yè)高效利用數(shù)據(jù)的新需求。
比如用戶在需要它們的時候可以隨時調用,這個階段網(wǎng)盤的價值在于提供一個目錄或者索引,可以快捷高效的找到文件。
而未來十年,隨著信息化越來越高,用戶需求也會隨之轉向。
一方面,知識化是一個大方向的趨勢,AI將有用的信息梳理成知識,無論是即時的還是過往的,用戶都可以輕松快捷的找到它并知識化它。
什么是知識化?
信息化的特點是淺層理解與離散化,而知識是信息的集合,是從相關信息中過濾、提煉及加工而得到的有用資料。知識基于推理和分析,還可能產(chǎn)生新的知識。
而百度網(wǎng)盤的知識化,可以將其理解為提供了一種對信息的理解、記憶、推理和連接的能力。它的作用類似汞,能從金砂中提煉出黃金。
三年前,百度網(wǎng)盤曾對行業(yè)未來作出判斷。認為網(wǎng)盤能力將活躍于包括手機、音箱、電視在內的智能終端,用戶可以“隨時隨地上傳數(shù)據(jù)到云端,或在終端呈現(xiàn)內容”。同時,用戶會更愿意直接在網(wǎng)盤操作和處理數(shù)據(jù),而不是將其下載到本地。
今天百度網(wǎng)盤知識化的越級,對應的正是三年前的這個預判。
基于這些,未來百度網(wǎng)盤就能依托知識化構建網(wǎng)盤第二大腦,成為每個人都擁有的個人數(shù)字助理。
而這背后,都離不開百度長久以來對技術的長久投入和創(chuàng)新。
比如文字理解,百度網(wǎng)盤采用圖像預訓練大模型技術,能夠利用更多的上下文信息,并通過自監(jiān)督的思路提高效率和準確率。
再比如圖像理解,依托文心大模型,百度網(wǎng)盤將模型規(guī)??s小,成本下降的同時效率上去了。依托文心大模型,百度網(wǎng)盤的的解決方案百度網(wǎng)盤的的解決方案,在16個場景中有10個領域處于領先地位,并已廣泛應用于網(wǎng)盤的照片故事和圖片視頻搜索中,支持復雜語義和多模態(tài)的搜索能力。
還有人像美化,除了提供基本的人像美化效果與競品一致外,在保持效果的前提下,百度網(wǎng)盤將部分核心模型大小壓縮到百KB,推理耗時降低到百毫秒。
最后是音視頻理解。百度網(wǎng)盤的自動語音識別(ASR)涵蓋了中、英、韓等多個國家的語言,識別和翻譯準確率也處于行業(yè)領先地位。
尾聲
讓我們回到開頭的例子:《西部世界》和《星際穿越》都是科幻電影,但它們對于AI的立意卻是截然相反:前者刻畫了AI覺醒,而后者則是描述了AI為人類貢獻。
今天我們能體驗到的AI,包括百度網(wǎng)盤、chatGPT、Midjourney等等,它們現(xiàn)存的形態(tài)亦或者未來的進化方向,基本都是一類的,智能協(xié)同、彼此優(yōu)勢互補,實現(xiàn)更高效、更準確的工作成果。
百度網(wǎng)盤結合AI實現(xiàn)過目不忘和出口成章,是拓寬了我們語言的邊界,但它背后是人類不斷通過創(chuàng)造工具來增強自我的進化過程。
同時,人不是AI,人有語言與知識,也有體驗與感知。這是屬于我們更大的世界。
如果把語言和知識比做“讀萬卷書”,也許AI能比人做的更好。
但是體驗與感知是“行萬里路”,這里不是單純的指去旅游,而是用心去生活,去體會,去感悟,這是AI所無法替代的。
最后和大家分享一句話:AI是工具,人生是體驗。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 100億美元史上最大融資的背后,國內外巨頭齊瞄準Data+AI
- 有一種羨慕叫“別人家的年終獎”:京東采銷平均23薪,全網(wǎng)熱議“人的價值”
- 行業(yè)首個“人機大戰(zhàn)”對壘!AI翻譯已媲美人工
- 蘋果開啟年終大促,降價1200元,被國產(chǎn)手機嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長三角,如何把數(shù)據(jù)要素變成新長江?
- 大模型,在內卷中尋找出口
- 比亞迪“天神之眼”重磅升級:無圖城市領航功能全國開通
- 不愿成為微信的支付寶,注定失敗
- 大廠年終獎全靠猜?京東帶頭透明化
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。