123,123,123

從全球視野看，OpenAI、谷歌等AI巨頭，以及百度、昆侖萬維等中國科技公司，作為推動(dòng)技術(shù)創(chuàng)新的關(guān)鍵力量，成為各自地區(qū)AI發(fā)展的風(fēng)向標(biāo)。

不同地區(qū)的AI企業(yè)各有千秋，但技術(shù)發(fā)展的潮水方向卻大體相同，那就是：技術(shù)做高，產(chǎn)品做廣。

所謂技術(shù)做高，指的是模型能力的持續(xù)進(jìn)階。比如今年4月17日開啟公測的天工3.0，就是全球首個(gè)多模態(tài)“超級(jí)模型”（Super Model），具備多模態(tài)、搜索增強(qiáng)等能力，同期，又接連發(fā)布了全球首個(gè)開源AI音樂大模型SOTA。而隨后5月份OpenAI發(fā)布的最新大模型GPT-4o，也強(qiáng)調(diào)了多模態(tài)大一統(tǒng)的能力，谷歌也在隨后的Gemini Astra中展示了類似能力。

所謂產(chǎn)品做廣，指的是模型落地需要豐富的軟硬件產(chǎn)品作為支撐。這一點(diǎn)上，相比“OpenAI+微軟”的合作模式，谷歌、昆侖萬維這樣“自有模型+自有產(chǎn)品生態(tài)”自成一派的廠商，更容易加速AI產(chǎn)品化。比如天工AI在去年就已經(jīng)推出的中國第一款A(yù)I搜索，剛剛上線的全網(wǎng)唯一AI視頻轉(zhuǎn)繪功能，天工AI儼然已經(jīng)實(shí)現(xiàn)了AI搜索、文生圖、圖像處理、AI PPT、AI動(dòng)漫、AI音樂、AI視頻轉(zhuǎn)繪等多元應(yīng)用，日活躍用戶數(shù)已經(jīng)突破百萬，成為中國頭部AIGC資深玩家。

谷歌也在I/O開發(fā)者大會(huì)一口氣拿出來十來款新品及升級(jí)，展現(xiàn)出了極強(qiáng)的商業(yè)潛力，會(huì)后帶動(dòng)了谷歌的股價(jià)上漲。

說到這里，想必讀者們已經(jīng)發(fā)現(xiàn)了，昆侖萬維的天工AI與谷歌的Gemini，在技術(shù)路線和產(chǎn)品能力上具備相似性，而且目前針對(duì)C端用戶完全免費(fèi)，而且覆蓋各種設(shè)備、使用場景的需求。

這讓我想到了宋代詞人一首鼓勵(lì)學(xué)子“趕考”的詞：看蒲質(zhì)易凋，何如松茂，菊花已老，須是梅開。萬事何難，時(shí)來得做，且信天工次第排。從今去，愿徑游璧水，直上蘭臺(tái)。

如果我們將科技企業(yè)的技術(shù)創(chuàng)新，看作是一場“趕考”，那么有理由相信，AI搜索、多模態(tài)等最新考題，對(duì)中國企業(yè)并不是很大的困難。只要堅(jiān)持去做，時(shí)機(jī)一到，便會(huì)如經(jīng)過寒夜的梅花一般綻放。

至少，最新的AI產(chǎn)品，比如谷歌在海外獨(dú)占優(yōu)勢的AI搜索，以及時(shí)下正處于大模型金字塔尖的多模態(tài)，天工3.0都具備上述特性。

從這一點(diǎn)上看，中國AI，終于有了一點(diǎn)“萬事何難，時(shí)來得做，且信天工”的淡定。

我們不妨借著當(dāng)下最火的兩大AI能力說開去，聊聊昆侖萬維天工3.0是如何做到一流水平的，以及天工大模型這一株“AI梅花”開放的過程。

AI搜索：天工3.0與谷歌的獨(dú)特芬芳

放眼全球，僅有在搜索業(yè)務(wù)上有底蘊(yùn)、模型技術(shù)上有創(chuàng)新的廠商，比如谷歌、昆侖萬維、百度等，以及背靠亞馬遜的新秀Perplexity，才能在搜索效率、智能性、個(gè)性化體驗(yàn)上取得突破，培育出AI搜索這一獨(dú)具特色的成果，為用戶帶來了前所未有的搜索體驗(yàn)。

為什么AI搜索是頭部大模型廠商的關(guān)鍵賽點(diǎn)？一是體驗(yàn)優(yōu)勢，傳統(tǒng)搜索引擎的精準(zhǔn)度不高，用戶容易被各種廣告和釣魚帖干擾，在海量信息里大海撈針，搜索效率與體驗(yàn)都急需得到改善；二是流量優(yōu)勢，早在傳統(tǒng)互聯(lián)網(wǎng)時(shí)代，搜索引擎就是流量匯聚的入口，也是商業(yè)價(jià)值的體現(xiàn)，到了AIGC時(shí)代，人類創(chuàng)作、AI創(chuàng)作的內(nèi)容規(guī)模更是非線性增長，用戶找到想要信息的難度也前所未有地增大，搜索工具變得更為重要，虹吸流量的能力毋庸置疑。

最近的谷歌I/O發(fā)布會(huì)上，就推出了許多基于Gemini大模型的搜索功能。幸好，通過天工3.0，我們也能欣賞到中國“AI搜索”的獨(dú)特魅力。

目前，一流水平的AI搜索，有三個(gè)能力值得關(guān)注：

能力一：多模態(tài)，圖文并茂的搜索體驗(yàn)。

多模態(tài)搜索是一種先進(jìn)的搜索技術(shù)，允許用戶通過多種類型的數(shù)據(jù)（模態(tài)）進(jìn)行搜索查詢，能夠更全面地理解和響應(yīng)用戶的查詢需求，提供更加豐富和準(zhǔn)確的搜索結(jié)果。目前，僅有昆侖萬維、谷歌等少數(shù)廠商，可以將文本、圖片、音頻、腦圖等多形態(tài)答案集成在一起，給用戶圖文并茂的搜索體驗(yàn)。

比如，當(dāng)用戶要求大模型提供一個(gè)三天的膳食計(jì)劃：

OpenAI的GPT-4只支持文字版本，菜品啥樣全靠用戶自己想象：

谷歌最新的Gemini大模型，則支持圖文雙模態(tài)搜索：

天工3.0則支持多模態(tài)一體化搜索：

能力二：更強(qiáng)推理，復(fù)雜任務(wù)輕松搞定。

模型能力的提升，帶來了更強(qiáng)的邏輯推理能力，也讓搜索從傳統(tǒng)的“被動(dòng)呈現(xiàn)”進(jìn)階為AIGC的“主動(dòng)生成”。比如天工3.0通過4000億級(jí)參數(shù)MoE混合專家模型，在模型語義理解、邏輯推理，以及通用性、泛化性、不確定性知識(shí)、學(xué)習(xí)能力等領(lǐng)域都有著大幅的性能提升，從而在實(shí)際應(yīng)用中更加準(zhǔn)確和高效地處理信息。

在天工的“搜索增強(qiáng)”模式中，在分析某個(gè)具體行業(yè)的信息時(shí)，或者遇到寬泛問題時(shí)，天工AI能夠?qū)崿F(xiàn)總結(jié)相關(guān)事件、拆解產(chǎn)業(yè)鏈地圖等復(fù)雜功能，或者拆解問題進(jìn)行多步驟推理，并以結(jié)構(gòu)化或思維導(dǎo)圖以及PPT的形式進(jìn)行最終展示。

我們一起來試試報(bào)志愿相關(guān)問題，會(huì)發(fā)現(xiàn)天工AI可以將問題所涉及的領(lǐng)域逐一推理拆解，這與Gemini重磅出擊的多步驟推理完全是一個(gè)邏輯。

我們?cè)賮砼e個(gè)例子，當(dāng)用戶在搜索A新能源汽車時(shí)，想跟B品牌進(jìn)行參數(shù)對(duì)比，不需要自己在不同網(wǎng)頁間反復(fù)橫跳，天工3.0支持多個(gè)產(chǎn)品橫向?qū)Ρ?，智能整合全網(wǎng)優(yōu)質(zhì)信息，并輸出圖表，通過AIGC減少用戶的操作步驟，讓關(guān)鍵信息一覽無余。

在此基礎(chǔ)上，搜索還可以更進(jìn)一步嗎？讓AI幫助用戶整理分析既有信息，直接給出深度結(jié)果，也就是“搜索+分析+生成”合二為一，從檢索工具變成智慧的個(gè)人助手，這可能嗎？

天工3.0新增的搜索增強(qiáng)、多次調(diào)用聯(lián)網(wǎng)搜索、Agent等能力，支持復(fù)雜問題深度拆解，agent智能體能夠獨(dú)立完成規(guī)劃、調(diào)用、組合外部工具及信息，以精準(zhǔn)高效地完成產(chǎn)業(yè)分析、產(chǎn)品對(duì)比等各類復(fù)雜需求。

數(shù)萬字的市場調(diào)研報(bào)告、高級(jí)學(xué)術(shù)研究、企業(yè)研報(bào)、白皮書等任務(wù)，天工3.0都可以快速完成，并且每個(gè)搜索落地頁都支持AI速讀，一鍵生成AI摘要和要點(diǎn)提煉，其中有任何不懂的地方，還可以隨時(shí)通過【聊天】功能向AI助手發(fā)起多輪對(duì)話提問。

對(duì)于平時(shí)要閱讀大量產(chǎn)業(yè)研究報(bào)告、AI論文的創(chuàng)作者來說，我明顯體會(huì)到，這一套搜索增強(qiáng)的“組合拳”，確實(shí)能幫日常工作提升效率、減輕負(fù)擔(dān)。搜索的結(jié)果還可以用大綱、腦圖的豐富形式呈現(xiàn)，非常清晰。

能力三：緊跟時(shí)事，搜索生成也可以很有時(shí)效性。

大模型的訓(xùn)練周期較長，需要大量數(shù)據(jù)，而數(shù)據(jù)集的收集、整理和更新是一個(gè)耗時(shí)的過程。因此，大多數(shù)大模型在發(fā)布時(shí)都有一個(gè)明確的“知識(shí)截止日期”，即模型所包含的知識(shí)信息只更新到這個(gè)日期為止。超過這個(gè)日期的信息，模型可能就無法準(zhǔn)確提供。

這意味著，用戶在搜索一些時(shí)效性很強(qiáng)的信息時(shí)，比如最新的新聞事件、旅游規(guī)劃需要的實(shí)時(shí)信息、航班天氣股市等動(dòng)態(tài)信息搜索查詢，部分AI搜索提供的結(jié)果，可能缺乏準(zhǔn)確性和時(shí)效性。解決大模型的時(shí)效性問題，是昆侖萬維、谷歌等頭部廠商都在努力的目標(biāo)。

前不久谷歌的發(fā)布會(huì)上，就推出了支持“旅游規(guī)劃”的實(shí)時(shí)搜索demo，天工3.0的AI搜索產(chǎn)品，則是國內(nèi)唯一能夠支持實(shí)時(shí)天氣、股市、星座運(yùn)勢等信息查詢的AI產(chǎn)品，能夠同時(shí)生成特定卡片和對(duì)應(yīng)文本分析。有了這個(gè)功能，真的可以把手機(jī)上的n個(gè)軟件都卸載掉了。

從上述三大能力，可以看到基于“超級(jí)模型”做出的AI搜索產(chǎn)品，正在前所未有地改變?nèi)蛴脩舻乃阉黧w驗(yàn)。AI搜索，已經(jīng)成為昆侖萬維、谷歌等獨(dú)特的護(hù)城河，也是大模型底座上生長出的獨(dú)特的一枝梅花，散發(fā)著“人無我有，人有我強(qiáng)”的技術(shù)芬芳。

多模態(tài)：超級(jí)模型底座上長出的應(yīng)用繁花

作為全球首個(gè)多模態(tài)“超級(jí)模型（Super Model）”，天工3.0集自然語言處理、計(jì)算機(jī)視覺、多模態(tài)、AI搜索、AI智能體等多項(xiàng)尖端技術(shù)于一體，目前沒有任何一款A(yù)I工具集這么多模型能力于一身，在多模態(tài)領(lǐng)域是當(dāng)之無愧的先鋒。

在天工3.0這棵“梅樹”的根基上，昆侖萬維憑借“All in AGI 與 AIGC” 戰(zhàn)略，已經(jīng)孕育出了眾多的應(yīng)用花蕾，支持AIGC時(shí)代的內(nèi)容創(chuàng)作。

對(duì)于創(chuàng)作者來說，可以通過天工大模型獲得多種模態(tài)的模型能力，處理多種不同類型的數(shù)據(jù)輸入，包括：

視頻模態(tài)。天工3.0 AI視頻轉(zhuǎn)繪，可以實(shí)現(xiàn)自動(dòng)化的視頻生成，將現(xiàn)有的視頻內(nèi)容自動(dòng)轉(zhuǎn)換成不同的風(fēng)格或格式，像Sora一樣輔助用戶實(shí)現(xiàn)創(chuàng)意視頻項(xiàng)目的制作。

音頻數(shù)據(jù)。天工SkyMusic音樂大模型SOTA，是全球首款對(duì)標(biāo)suno的音樂大模型，通過大模型技術(shù)實(shí)現(xiàn)樂器、人聲、旋律、音量、音符的一體化端到端音樂生成，助力音樂創(chuàng)作者生成高質(zhì)量的AI音樂。尤為特別的是，SOTA支持粵語、成都話、北京話等眾多方言，讓用戶能夠更自由地實(shí)現(xiàn)音樂表達(dá)，傳播方言文化。這一大模型的推出，不僅展現(xiàn)了中國在AI音樂生成領(lǐng)域的技術(shù)實(shí)力，也為音樂產(chǎn)業(yè)帶來了新的可能性。淺淺展示一段天工AI音樂創(chuàng)作的作品，依然是完全免費(fèi)，還無需擔(dān)心版權(quán)問題。

智能體。在多模態(tài)環(huán)境中，智能體可以整合不同模態(tài)的信息，提供更加豐富和智能的交互體驗(yàn)。天工3.0支持用戶創(chuàng)建智能體，實(shí)現(xiàn)個(gè)性化的服務(wù)和交互體驗(yàn)，是大模型技術(shù)應(yīng)用的一種重要方式，可以推動(dòng)大模型技術(shù)的創(chuàng)新、普及和商業(yè)化。

PPT。PPT演示文稿的制作，需要結(jié)合文本、圖像、圖表、視頻和音頻等多種模態(tài)。

天工AI的PPT生成功能可以快速將文本內(nèi)容轉(zhuǎn)換成PPT幻燈片，提高制作PPT的效率，并且支持WEB端和APP端，意味著無論是在電腦上還是手機(jī)上，用戶都可以方便地使用這一功能來提升生產(chǎn)力。5分鐘做完一份優(yōu)質(zhì)的PPT，再也不是難事，而且完全免費(fèi)，不需要你在下載文件前支付任何費(fèi)用。

圖表。視覺表示的數(shù)據(jù)，如條形圖、餅圖、折線圖等，在數(shù)據(jù)分析、信息可視化、商業(yè)智能等領(lǐng)域中非常重要。最新的天工3.0大模型，可以自動(dòng)生成各種圖表，并分析結(jié)果，自動(dòng)生成報(bào)告或總結(jié)，與用戶進(jìn)行互動(dòng)，提供基于數(shù)據(jù)的深入見解。

放眼全球大模型競賽，不同模態(tài)的相互補(bǔ)充、統(tǒng)一、協(xié)作，可以提供更全面的理解能力，大幅提升AIGC在行業(yè)的應(yīng)用效果。因此，多模態(tài)絕對(duì)是一個(gè)主流方向，無論是OpenAI的GPT系列，還是谷歌的Gemini家族，都以此為發(fā)展方向，覆蓋多種模態(tài)。幸好，天工3.0為代表的中國大模型梯隊(duì)，也并不遜色。

基于天工系列大模型，昆侖萬維已構(gòu)建起AI大模型、AI搜索、AI音樂、AI社交、AI動(dòng)漫、AI游戲等AI業(yè)務(wù)矩陣，AI應(yīng)用場景的一個(gè)個(gè)綻放，中國AI的花香已撲面而來。

梅香清且遠(yuǎn)，AI春已至

值得一提的是，相比OpenAI和谷歌的ToC色彩，中國AI有著更為豐富、廣闊的應(yīng)用場景，不僅ToC應(yīng)用的用戶規(guī)模龐大，ToB/ToG政企市場將AIGC作為千行萬業(yè)提質(zhì)增效的把手，產(chǎn)業(yè)智能的前景也格外廣闊。

栽種一棵基礎(chǔ)模型的梅樹，培育AIGC的應(yīng)用繁花，天工大模型成為產(chǎn)業(yè)智能化的一道風(fēng)景。昆侖萬維作為AI園丁，有著獨(dú)特的氣質(zhì)：

1.極長的耕耘耐心。

AI創(chuàng)新需要在土壤和時(shí)間中蘊(yùn)育，昆侖萬維2019年布局AIGC的前瞻性格局。以AI搜索為例，昆侖萬維的自研實(shí)力來自長期主義戰(zhàn)略。

2.極強(qiáng)的工程能力和產(chǎn)品匠心。

基座模型達(dá)到一定參數(shù)，接下來比拼的是誰能把工程化、產(chǎn)品化做得更好。以AI搜索為例，“魔鬼都藏在細(xì)節(jié)中”，比如怎么消除大模型的幻覺，哪些問題深度要求高，哪些問題實(shí)時(shí)性要求高，做出對(duì)應(yīng)的處理，體現(xiàn)出不同產(chǎn)品的區(qū)別，直接影響到用戶體驗(yàn)，需要體系化的工程能力和產(chǎn)品設(shè)計(jì)能力。這一點(diǎn)，天工AI有大量產(chǎn)業(yè)實(shí)際，比如用天工AI搜索寫公文引用官方媒體，獲得政府用戶的信任。

3.極高的人才密度。

人才是AI創(chuàng)新的前提和基礎(chǔ)。只有擁有一支強(qiáng)大的人才隊(duì)伍，AI企業(yè)才能不斷推動(dòng)技術(shù)創(chuàng)新，開發(fā)出更多有價(jià)值的產(chǎn)品和服務(wù)，從這一點(diǎn)來說，基礎(chǔ)大模型領(lǐng)域呈現(xiàn)出“強(qiáng)者益強(qiáng)”，頭部AI巨頭大廠與其他中小廠的差距不斷拉大。以昆侖萬維為例，整個(gè)大模型研發(fā)中心高級(jí)算法工程師多達(dá)300人+，其中海內(nèi)外名校博士100+，大量人才來自微軟、阿里、百度，人才規(guī)模具備明顯實(shí)力優(yōu)勢。

昆侖萬維作為國內(nèi)模型技術(shù)與工程能力最強(qiáng)、布局最全面的人工智能企業(yè)之一，可以打出一套全球AI產(chǎn)品組合拳，一套覆蓋ToC/ToB/ToG多個(gè)市場的商業(yè)組合拳。

“待到山花爛漫時(shí)，她在叢中笑”，面對(duì)OpenAI和谷歌等世界一流AI巨頭，天工AI正綻放出梅花一般自信的微笑。當(dāng)我們輕嗅著中國AIGC應(yīng)用的陣陣芬芳，可以說一句：萬事何難，且信天工。

體驗(yàn)基于多模態(tài)大模型的AI搜索，可前往天工3.0官網(wǎng)。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

多模態(tài)與AI搜索的全球科技競速：中國AI，且信天工

下一篇