人工智能發(fā)展進入場景時代,AI+耳機開啟辦公效率躍遷

人工智能發(fā)展已經是大勢所趨,只是對于各種發(fā)展的方向和應用的落地,其實還是有很多爭議,甚至連做大模型還是小模型,是開源還是閉源業(yè)內也沒有達成一個統(tǒng)一的共識。所以在這個時間節(jié)點,行業(yè)的討論就格外有價值。

2024年全球世界人工智能大會在7月4日于上海召開,數(shù)百個AI大模型、千奇百怪的AI+硬件、上千位全球科技、產業(yè)界領軍人物都濟濟一堂,要將AI領域的發(fā)展共識再向前推進一步。

聚焦場景,奔向Agent

在7月4號的時候,2024世界人工智能大會公布了一系列的“鎮(zhèn)館之寶”,其中包括支付寶智能助理、商湯科技首個面向C端用戶的可控人物視頻生成大模型Vimi、阿里云AI編程助手通義靈碼、智譜AI基座大模型、特斯拉賽博越野旅行車、聯(lián)想YOGA Book 9i 筆記本、智能飛行器等等。

從這些來頭不小的產品中,我們可以看出,AI大模型的應用落地應該是當前最為緊迫的話題,而各大廠商的競爭已經從大模型對海外GPT的追趕開始逐漸聚焦回了本地的應用落地。

此前,業(yè)界對大模型的發(fā)展趨勢充滿爭議,開源大模型成本高昂,目前的落地前景還在探索之中,當大模型不能以合適的成本帶來相應的價值時,選擇閉源模型就是更符合商業(yè)化需要的選擇。同時,小模型比大模型更迅捷、成本更低、落地的可能性也更大,已經有很多AI產品開始了小模型的競賽。

無獨有偶,未來智能的CTO王松也在一場直播中表達了類似的觀點,找到合適的商業(yè)模式去賺錢非常重要,包括OpenAI現(xiàn)在也在從非盈利轉型盈利,做了很多收費和應用落地方面的嘗試。

未來智能自研了聚焦在辦公會議場景的垂直小模型,一方面這種垂直模型與自己的商業(yè)模式匹配,用更經濟可持續(xù)的成本更好的賦能自己的會議耳機產品上;一方面實現(xiàn)了AI的場景化和實用化,真正為用戶創(chuàng)造價值。未來智能的訊飛會議耳機,是目前業(yè)界少有的將AI做到實用、真正解決用戶痛點的AI+智能硬件產品。

事實上,目前業(yè)內在C端應用上還有一定的共識,就是認為AI Agent將會是一條必由之路。AI Agent簡單地說可以理解為在某種在大語言模型基礎上,能自主感知、規(guī)劃決策、執(zhí)行復雜任務的智能體,是可以脫離人為控制,自主決策和執(zhí)行任務的存在。

如果舉一個大家比較熟悉的例子就是鋼鐵俠的助手“賈維斯”,實際上就是這么一個完成度極高的AI Agent,不過王松也表示,目前在市面上并沒有見到做的非常好的AI Agent,很多有希望的產品也要在兩三年后才可能成熟落地。因為AI Agent是要真正完成一個指令的,如果出現(xiàn)了AI幻覺,那后果是會非常嚴重的。

王松也分享了目前未來智能在AI Agent方面的展望及探索,聚焦在幫助用戶用AI解決會議場景的各種問題,比如讓AI幫助用戶能夠自動開會,自動參加會議,甚至不需要你本人來聽,我?guī)湍懵牐瑫髱湍憧偨Y、生成摘要、發(fā)送文件,甚至會后可以通過問答的形式直接從文字中提煉答案。

所以雖然這是一個小小的耳機,因為有了AI的嵌入,耳機變成用戶的超級助手。當然,將AI Agent植入耳機還需要一個過程,未來智能的做法,是先做好做實一個個小場景需求,然后將這些場景Buff疊加,最終實現(xiàn)真正實用的AI Agent。

王松說的對么?

其實看到這個直播的內容,我還是有點熟悉的,因為我一直就是訊飛會議耳機的重度用戶,從實時錄音轉寫到翻譯功能,再到不斷升級AI功能,這款小小的耳機每一項功能設計都非常實用。

作為一個媒體人,訊飛會議耳機其實就是一個高效工作的秘密武器,它不僅更輕便,更方便,而且可以自動把采訪內容轉成文字,還會分清楚不同的采訪對象說的話,甚至viaim AI會議助理可以對記錄內容進行“摘要總結”和“待辦事項”提取,最新版本甚至推出了全新的“智能詢問”功能,只需語音/文字輸入問題,viaim AI就能回答關于當前記錄內提到的問題和擴展問題,快速獲取到需要的會議信息。viaim AI就是一個顯而易見的AI場景落地,帶來了赤裸裸的生產力提升。

所以王松說的還是非常有道理的,基于自己的商業(yè)模式,在一個領域進行聚焦和落地,也是一個非?,F(xiàn)實且有效的路徑。訊飛會議耳機雖然叫會議耳機,但實際上是適用于任何語言交流和需要文字整理的場景的,當然不管是采訪還是談判,大概都可以歸納在會議這一類中。

除此之外,同傳聽譯和面對面翻譯功能也是出國與國際友人對話的利器,外國人說的話會直接翻譯成中文出現(xiàn)在你耳機里,而你說的話則會被翻譯成文字顯示在手機上,科幻電影中的場景終于到今天被科技實現(xiàn)了。這其中支持了32種語言,12種方言和10種行業(yè)術語甚至還有兩種少數(shù)民族語言,對于商務人士來說,這可能是另一個AI帶來的重要剛需場景落地。當然,這背后也都是訊飛多年來在AI領域深耕帶來的成果。

語音說,屬于AI時代的交互方式

未來智能核心團隊在AI領域深耕多年,在語音識別、語音轉文字、實時翻譯等領域都有著非常領先的水準。未來智能公司從建立之初,就聚焦于智能辦公場景,非常針對性的進行相應的功能開發(fā),逐漸成為該領域的行業(yè)領軍企業(yè),產品也得到了廣大消費的認同。而人工智能大模型的誕生更為未來智能產品插上了騰飛的翅膀,viaim AI會議助理成為AI Agent領域最具實用性和落地性的產品突破。

現(xiàn)在,使用訊飛會議耳機就可以帶來非常直接的工作效率上升和工作強度下降,它掀開了AI時代的一個小小的序幕,更多人通過這款產品才真正切實體驗到AI的能力和價值。

在王松的直播中,還提到了一個觀點,OpenAI的聯(lián)合創(chuàng)始人,特斯拉autopilot的主要的技術負責人之一,在推特上表示,未來的computer2.0的架構,可能沒有OS的概念了,就是一個神經網絡??赡芫褪且粋€球,大家跟它對話就可以了。這一點相信喜歡鋼鐵俠的朋友也不會陌生,賈維斯在電影中的形態(tài)就是這么一個能量球,不過它在蛻變成幻視的時候,還是有了一個軀殼。不過它的對頭另一個人工智能奧創(chuàng)就更典型一點,它存在于各種不同的設備之中,并不需要一個固定的形態(tài),雖然為了電影好看,也給他做了一個機器人的身體。

這就意味著,之前人們熟悉的電腦鍵鼠交互和手機觸屏交互可能會真正讓位于語音交互,而電腦和手機這樣的產品也會有全新的形態(tài),而仔細思考下來,訊飛會議耳機這個搶位倒是有些直擊本質,畢竟沒有什么比一個小小的耳機更方便隨身攜帶和進行交互了,至于說顯示設備,完全是可以共享的。

現(xiàn)在,通過viaim AI的智能詢問功能,你可以語音向viaim AI提問,viaim AI能快速回答你所需要的信息。未來,走到酒店,打開聯(lián)網的屏幕,直接用耳機下命令,也許就能完成大部分的工作和娛樂,這一天恐怕并不會太遙遠。只不過那時候的耳機可能也會有全新的形態(tài),甚至自帶全息投影的屏幕也不一定,按照這個方向思考下去,這個全新的智能時代還真的讓人倍感期待。

AI發(fā)展到現(xiàn)在,一場“未來”淘汰“傳統(tǒng)”的戰(zhàn)爭其實正在進行中。訊飛會議耳機已成為爆款產品,進入了大眾消費市場。在今年618大促中,訊飛會議耳機不僅實現(xiàn)了連續(xù)3年銷售額同步增長3倍+,保持了會議耳機品類銷售額冠軍地位,還在代表行業(yè)的藍牙耳機或影音耳機大類目中,銷售額進入第一梯隊,在天貓和抖音平臺位居TOP4。AIGC智能耳機正在快速普及,這也是證明了AI,正在驅動未來。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-07-09
人工智能發(fā)展進入場景時代,AI+耳機開啟辦公效率躍遷
人工智能發(fā)展進入場景時代,AI+耳機開啟辦公效率躍遷

長按掃碼 閱讀全文