多模態(tài)與AI搜索的全球科技競速:中國AI,且信天工

從全球視野看,OpenAI、谷歌等AI巨頭,以及百度、昆侖萬維等中國科技公司,作為推動技術創(chuàng)新的關鍵力量,成為各自地區(qū)AI發(fā)展的風向標。

不同地區(qū)的AI企業(yè)各有千秋,但技術發(fā)展的潮水方向卻大體相同,那就是:技術做高,產品做廣。

所謂技術做高,指的是模型能力的持續(xù)進階。比如今年4月17日開啟公測的天工3.0,就是全球首個多模態(tài)“超級模型”(Super Model),具備多模態(tài)、搜索增強等能力,同期,又接連發(fā)布了全球首個開源AI音樂大模型SOTA。而隨后5月份OpenAI發(fā)布的最新大模型GPT-4o,也強調了多模態(tài)大一統(tǒng)的能力,谷歌也在隨后的Gemini Astra中展示了類似能力。

所謂產品做廣,指的是模型落地需要豐富的軟硬件產品作為支撐。這一點上,相比“OpenAI+微軟”的合作模式,谷歌、昆侖萬維這樣“自有模型+自有產品生態(tài)”自成一派的廠商,更容易加速AI產品化。比如天工AI在去年就已經推出的中國第一款AI搜索,剛剛上線的全網唯一AI視頻轉繪功能,天工AI儼然已經實現(xiàn)了AI搜索、文生圖、圖像處理、AI PPT、AI動漫、AI音樂、AI視頻轉繪等多元應用,日活躍用戶數(shù)已經突破百萬,成為中國頭部AIGC資深玩家。

谷歌也在I/O開發(fā)者大會一口氣拿出來十來款新品及升級,展現(xiàn)出了極強的商業(yè)潛力,會后帶動了谷歌的股價上漲。

說到這里,想必讀者們已經發(fā)現(xiàn)了,昆侖萬維的天工AI與谷歌的Gemini,在技術路線和產品能力上具備相似性,而且目前針對C端用戶完全免費,而且覆蓋各種設備、使用場景的需求。

這讓我想到了宋代詞人一首鼓勵學子“趕考”的詞:看蒲質易凋,何如松茂,菊花已老,須是梅開。萬事何難,時來得做,且信天工次第排。從今去,愿徑游璧水,直上蘭臺。

如果我們將科技企業(yè)的技術創(chuàng)新,看作是一場“趕考”,那么有理由相信,AI搜索、多模態(tài)等最新考題,對中國企業(yè)并不是很大的困難。只要堅持去做,時機一到,便會如經過寒夜的梅花一般綻放。

至少,最新的AI產品,比如谷歌在海外獨占優(yōu)勢的AI搜索,以及時下正處于大模型金字塔尖的多模態(tài),天工3.0都具備上述特性。

從這一點上看,中國AI,終于有了一點“萬事何難,時來得做,且信天工”的淡定。

我們不妨借著當下最火的兩大AI能力說開去,聊聊昆侖萬維天工3.0是如何做到一流水平的,以及天工大模型這一株“AI梅花”開放的過程。

AI搜索:天工3.0與谷歌的獨特芬芳

放眼全球,僅有在搜索業(yè)務上有底蘊、模型技術上有創(chuàng)新的廠商,比如谷歌、昆侖萬維、百度等,以及背靠亞馬遜的新秀Perplexity,才能在搜索效率、智能性、個性化體驗上取得突破,培育出AI搜索這一獨具特色的成果,為用戶帶來了前所未有的搜索體驗。

為什么AI搜索是頭部大模型廠商的關鍵賽點?一是體驗優(yōu)勢,傳統(tǒng)搜索引擎的精準度不高,用戶容易被各種廣告和釣魚帖干擾,在海量信息里大海撈針,搜索效率與體驗都急需得到改善;二是流量優(yōu)勢,早在傳統(tǒng)互聯(lián)網時代,搜索引擎就是流量匯聚的入口,也是商業(yè)價值的體現(xiàn),到了AIGC時代,人類創(chuàng)作、AI創(chuàng)作的內容規(guī)模更是非線性增長,用戶找到想要信息的難度也前所未有地增大,搜索工具變得更為重要,虹吸流量的能力毋庸置疑。

最近的谷歌I/O發(fā)布會上,就推出了許多基于Gemini大模型的搜索功能。幸好,通過天工3.0,我們也能欣賞到中國“AI搜索”的獨特魅力。

目前,一流水平的AI搜索,有三個能力值得關注:

能力一:多模態(tài),圖文并茂的搜索體驗。

多模態(tài)搜索是一種先進的搜索技術,允許用戶通過多種類型的數(shù)據(模態(tài))進行搜索查詢,能夠更全面地理解和響應用戶的查詢需求,提供更加豐富和準確的搜索結果。目前,僅有昆侖萬維、谷歌等少數(shù)廠商,可以將文本、圖片、音頻、腦圖等多形態(tài)答案集成在一起,給用戶圖文并茂的搜索體驗。

比如,當用戶要求大模型提供一個三天的膳食計劃:

OpenAI的GPT-4只支持文字版本,菜品啥樣全靠用戶自己想象:

谷歌最新的Gemini大模型,則支持圖文雙模態(tài)搜索:

天工3.0則支持多模態(tài)一體化搜索:

能力二:更強推理,復雜任務輕松搞定。

模型能力的提升,帶來了更強的邏輯推理能力,也讓搜索從傳統(tǒng)的“被動呈現(xiàn)”進階為AIGC的“主動生成”。比如天工3.0通過4000億級參數(shù)MoE混合專家模型,在模型語義理解、邏輯推理,以及通用性、泛化性、不確定性知識、學習能力等領域都有著大幅的性能提升,從而在實際應用中更加準確和高效地處理信息。

在天工的“搜索增強”模式中,在分析某個具體行業(yè)的信息時,或者遇到寬泛問題時,天工AI能夠實現(xiàn)總結相關事件、拆解產業(yè)鏈地圖等復雜功能,或者拆解問題進行多步驟推理,并以結構化或思維導圖以及PPT的形式進行最終展示。

我們一起來試試報志愿相關問題,會發(fā)現(xiàn)天工AI可以將問題所涉及的領域逐一推理拆解,這與Gemini重磅出擊的多步驟推理完全是一個邏輯。

我們再來舉個例子,當用戶在搜索A新能源汽車時,想跟B品牌進行參數(shù)對比,不需要自己在不同網頁間反復橫跳,天工3.0支持多個產品橫向對比,智能整合全網優(yōu)質信息,并輸出圖表,通過AIGC減少用戶的操作步驟,讓關鍵信息一覽無余。

在此基礎上,搜索還可以更進一步嗎?讓AI幫助用戶整理分析既有信息,直接給出深度結果,也就是“搜索+分析+生成”合二為一,從檢索工具變成智慧的個人助手,這可能嗎?

天工3.0新增的搜索增強、多次調用聯(lián)網搜索、Agent等能力,支持復雜問題深度拆解,agent智能體能夠獨立完成規(guī)劃、調用、組合外部工具及信息,以精準高效地完成產業(yè)分析、產品對比等各類復雜需求。

數(shù)萬字的市場調研報告、高級學術研究、企業(yè)研報、白皮書等任務,天工3.0都可以快速完成,并且每個搜索落地頁都支持AI速讀,一鍵生成AI摘要和要點提煉,其中有任何不懂的地方,還可以隨時通過【聊天】功能向AI助手發(fā)起多輪對話提問。

對于平時要閱讀大量產業(yè)研究報告、AI論文的創(chuàng)作者來說,我明顯體會到,這一套搜索增強的“組合拳”,確實能幫日常工作提升效率、減輕負擔。搜索的結果還可以用大綱、腦圖的豐富形式呈現(xiàn),非常清晰。

能力三:緊跟時事,搜索生成也可以很有時效性。

大模型的訓練周期較長,需要大量數(shù)據,而數(shù)據集的收集、整理和更新是一個耗時的過程。因此,大多數(shù)大模型在發(fā)布時都有一個明確的“知識截止日期”,即模型所包含的知識信息只更新到這個日期為止。超過這個日期的信息,模型可能就無法準確提供。

這意味著,用戶在搜索一些時效性很強的信息時,比如最新的新聞事件、旅游規(guī)劃需要的實時信息、航班天氣股市等動態(tài)信息搜索查詢,部分AI搜索提供的結果,可能缺乏準確性和時效性。解決大模型的時效性問題,是昆侖萬維、谷歌等頭部廠商都在努力的目標。

前不久谷歌的發(fā)布會上,就推出了支持“旅游規(guī)劃”的實時搜索demo,天工3.0的AI搜索產品,則是國內唯一能夠支持實時天氣、股市、星座運勢等信息查詢的AI產品,能夠同時生成特定卡片和對應文本分析。有了這個功能,真的可以把手機上的n個軟件都卸載掉了。

從上述三大能力,可以看到基于“超級模型”做出的AI搜索產品,正在前所未有地改變全球用戶的搜索體驗。AI搜索,已經成為昆侖萬維、谷歌等獨特的護城河,也是大模型底座上生長出的獨特的一枝梅花,散發(fā)著“人無我有,人有我強”的技術芬芳。

多模態(tài):超級模型底座上長出的應用繁花

作為全球首個多模態(tài)“超級模型(Super Model)”,天工3.0集自然語言處理、計算機視覺、多模態(tài)、AI搜索、AI智能體等多項尖端技術于一體,目前沒有任何一款AI工具集這么多模型能力于一身,在多模態(tài)領域是當之無愧的先鋒。

在天工3.0這棵“梅樹”的根基上,昆侖萬維憑借“All in AGI 與 AIGC” 戰(zhàn)略,已經孕育出了眾多的應用花蕾,支持AIGC時代的內容創(chuàng)作。

對于創(chuàng)作者來說,可以通過天工大模型獲得多種模態(tài)的模型能力,處理多種不同類型的數(shù)據輸入,包括:

視頻模態(tài)。天工3.0 AI視頻轉繪,可以實現(xiàn)自動化的視頻生成,將現(xiàn)有的視頻內容自動轉換成不同的風格或格式,像Sora一樣輔助用戶實現(xiàn)創(chuàng)意視頻項目的制作。

音頻數(shù)據。天工SkyMusic音樂大模型SOTA,是全球首款對標suno的音樂大模型,通過大模型技術實現(xiàn)樂器、人聲、旋律、音量、音符的一體化端到端音樂生成,助力音樂創(chuàng)作者生成高質量的AI音樂。尤為特別的是,SOTA支持粵語、成都話、北京話等眾多方言,讓用戶能夠更自由地實現(xiàn)音樂表達,傳播方言文化。這一大模型的推出,不僅展現(xiàn)了中國在AI音樂生成領域的技術實力,也為音樂產業(yè)帶來了新的可能性。淺淺展示一段天工AI音樂創(chuàng)作的作品,依然是完全免費,還無需擔心版權問題。

智能體。在多模態(tài)環(huán)境中,智能體可以整合不同模態(tài)的信息,提供更加豐富和智能的交互體驗。天工3.0支持用戶創(chuàng)建智能體,實現(xiàn)個性化的服務和交互體驗,是大模型技術應用的一種重要方式,可以推動大模型技術的創(chuàng)新、普及和商業(yè)化。

PPT。PPT演示文稿的制作,需要結合文本、圖像、圖表、視頻和音頻等多種模態(tài)。

天工AI的PPT生成功能可以快速將文本內容轉換成PPT幻燈片,提高制作PPT的效率,并且支持WEB端和APP端,意味著無論是在電腦上還是手機上,用戶都可以方便地使用這一功能來提升生產力。5分鐘做完一份優(yōu)質的PPT,再也不是難事,而且完全免費,不需要你在下載文件前支付任何費用。

圖表。視覺表示的數(shù)據,如條形圖、餅圖、折線圖等,在數(shù)據分析、信息可視化、商業(yè)智能等領域中非常重要。最新的天工3.0大模型,可以自動生成各種圖表,并分析結果,自動生成報告或總結,與用戶進行互動,提供基于數(shù)據的深入見解。

放眼全球大模型競賽,不同模態(tài)的相互補充、統(tǒng)一、協(xié)作,可以提供更全面的理解能力,大幅提升AIGC在行業(yè)的應用效果。因此,多模態(tài)絕對是一個主流方向,無論是OpenAI的GPT系列,還是谷歌的Gemini家族,都以此為發(fā)展方向,覆蓋多種模態(tài)。幸好,天工3.0為代表的中國大模型梯隊,也并不遜色。

基于天工系列大模型,昆侖萬維已構建起AI大模型、AI搜索、AI音樂、AI社交、AI動漫、AI游戲等AI業(yè)務矩陣,AI應用場景的一個個綻放,中國AI的花香已撲面而來。

梅香清且遠,AI春已至

值得一提的是,相比OpenAI和谷歌的ToC色彩,中國AI有著更為豐富、廣闊的應用場景,不僅ToC應用的用戶規(guī)模龐大,ToB/ToG政企市場將AIGC作為千行萬業(yè)提質增效的把手,產業(yè)智能的前景也格外廣闊。

栽種一棵基礎模型的梅樹,培育AIGC的應用繁花,天工大模型成為產業(yè)智能化的一道風景。昆侖萬維作為AI園丁,有著獨特的氣質:

1.極長的耕耘耐心。

AI創(chuàng)新需要在土壤和時間中蘊育,昆侖萬維2019年布局AIGC的前瞻性格局。以AI搜索為例,昆侖萬維的自研實力來自長期主義戰(zhàn)略。

2.極強的工程能力和產品匠心。

基座模型達到一定參數(shù),接下來比拼的是誰能把工程化、產品化做得更好。以AI搜索為例,“魔鬼都藏在細節(jié)中”,比如怎么消除大模型的幻覺,哪些問題深度要求高,哪些問題實時性要求高,做出對應的處理,體現(xiàn)出不同產品的區(qū)別,直接影響到用戶體驗,需要體系化的工程能力和產品設計能力。這一點,天工AI有大量產業(yè)實際,比如用天工AI搜索寫公文引用官方媒體,獲得政府用戶的信任。

3.極高的人才密度。

人才是AI創(chuàng)新的前提和基礎。只有擁有一支強大的人才隊伍,AI企業(yè)才能不斷推動技術創(chuàng)新,開發(fā)出更多有價值的產品和服務,從這一點來說,基礎大模型領域呈現(xiàn)出“強者益強”,頭部AI巨頭大廠與其他中小廠的差距不斷拉大。以昆侖萬維為例,整個大模型研發(fā)中心高級算法工程師多達300人+,其中海內外名校博士100+,大量人才來自微軟、阿里、百度,人才規(guī)模具備明顯實力優(yōu)勢。

昆侖萬維作為國內模型技術與工程能力最強、布局最全面的人工智能企業(yè)之一,可以打出一套全球AI產品組合拳,一套覆蓋ToC/ToB/ToG多個市場的商業(yè)組合拳。

“待到山花爛漫時,她在叢中笑”,面對OpenAI和谷歌等世界一流AI巨頭,天工AI正綻放出梅花一般自信的微笑。當我們輕嗅著中國AIGC應用的陣陣芬芳,可以說一句:萬事何難,且信天工。

體驗基于多模態(tài)大模型的AI搜索,可前往天工3.0官網。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-05-29
多模態(tài)與AI搜索的全球科技競速:中國AI,且信天工
多模態(tài)與AI搜索的全球科技競速:中國AI,且信天工

長按掃碼 閱讀全文