大模型產(chǎn)品化,不過(guò)是三支舞

今天,擺在全球數(shù)百個(gè)AI大模型面前的,是一個(gè)共同的問(wèn)題:如何賺錢(qián)。

無(wú)論模型誕生地在中國(guó)還是美國(guó),無(wú)論屬于通用大模型還是垂直大模型,商業(yè)化可以說(shuō)是這項(xiàng)技術(shù)在全球范圍內(nèi)共同面對(duì)的問(wèn)題。

在大模型最初所帶來(lái)的震驚與喜悅過(guò)后,是大量AIGC平臺(tái)走向免費(fèi)開(kāi)放,大模型toB服務(wù)大打價(jià)格戰(zhàn)。花樣繁多的大模型,似乎始終無(wú)法激活用戶的付費(fèi)欲望。

而大家都知道,商業(yè)化的前提是產(chǎn)品化。雖然大模型帶來(lái)的AIGC能力本身就有著非常強(qiáng)烈的產(chǎn)品化屬性,但以一種軟件應(yīng)用來(lái)說(shuō),它還是過(guò)于粗陋和黑箱了。用戶需要自己去探索AIGC究竟能帶來(lái)什么,可能性有哪些,從而很難獲得確定性的產(chǎn)品滿足。另一方面,大模型在技術(shù)上的潛力也沒(méi)有被充分挖掘。一些需要在產(chǎn)品設(shè)計(jì)層面放大的基礎(chǔ)能力,還靜靜地躺在平臺(tái)那一長(zhǎng)串功能簡(jiǎn)介里。

于是,在全球共享的商業(yè)化壓力下,大模型產(chǎn)品化開(kāi)始提速。不分中美,無(wú)論是傳統(tǒng)科技巨頭還是新型AI公司,都開(kāi)始在大模型產(chǎn)品化上發(fā)力,推出了五花八門(mén),千姿百態(tài)的大模型產(chǎn)品化策略。

這種情況導(dǎo)致很多朋友會(huì)有點(diǎn)迷茫。放眼望去,感覺(jué)每家廠商都在做不一樣的AI產(chǎn)品,提出全新的AI概念。但仔細(xì)想象,好像又說(shuō)不出究竟哪里不同。

為了幫大家克服這種亂花漸欲迷人眼的“AI眩暈感”,我們盤(pán)點(diǎn)了目前大模型產(chǎn)品化的三種主要思路。

看不懂大模型產(chǎn)品化的諸多套路不要緊。我們只需要記住,今天的大模型,其實(shí)就是在跳三支舞。

通往全模態(tài)的胡旋舞

那些國(guó)際AI巨頭眼里的AI產(chǎn)品大概長(zhǎng)什么樣,這個(gè)問(wèn)題已經(jīng)漸漸有了答案:他們可能希望AI跟真人差不太多。

不久之前,OpenAI和谷歌接連發(fā)布了新的AI產(chǎn)品,也就是OpenAI最新的旗艦大模型GPT-4o,和谷歌的Project Astra。它們的共同點(diǎn),是都加入了跨文本、音頻與視覺(jué)的信息收集能力。換言之,大模型正在從只能聽(tīng)、讀、寫(xiě),變成同時(shí)也能看和說(shuō)。用戶與大模型之間的交互模式,也在越來(lái)越像與真人之間的交互模式,而且大模型可以在200到300毫秒的區(qū)間內(nèi)響應(yīng)音頻輸入,這已經(jīng)與人類之間的交流速度大體相同。

GPT-4o被稱作OpenAI有史以來(lái)最為產(chǎn)品化的一款應(yīng)用,就是因?yàn)樗又匾暸c用戶之間的互動(dòng)體驗(yàn),打磨了諸如響應(yīng)速度、具體使用功能等被定義在產(chǎn)品側(cè)的細(xì)節(jié)。更重要的是,GPT-4o開(kāi)創(chuàng)了一種新的產(chǎn)品模式:它比語(yǔ)音助手的交互形態(tài)更多,作用更廣,同時(shí)比傳統(tǒng)的AI對(duì)話框模式降低了使用門(mén)檻,增加了使用場(chǎng)景。

這種AI產(chǎn)品的使用體驗(yàn),非常接近于跟真人打視頻電話。很難不讓人想到電影《Her》或者《鋼鐵俠》中的賈維斯,雖然在使用體驗(yàn)上肯定不如它們,但產(chǎn)品邏輯已經(jīng)與科幻電影里對(duì)AI的使用想象一般無(wú)二。

我們有理由猜想,OpenAI在AI產(chǎn)品化上的思路,就是比對(duì)著科幻作品來(lái)進(jìn)行設(shè)計(jì)的,只不過(guò)他們恰好有機(jī)會(huì)把科幻變成現(xiàn)實(shí)。

這種“類視頻電話”的大模型產(chǎn)品模式,本質(zhì)上是將不同的AI感知、理解、生成能力進(jìn)行融合,就像胡旋舞會(huì)越轉(zhuǎn)越快,隨著大模型的不斷發(fā)展,AI技術(shù)也在越轉(zhuǎn)越快,把不同模態(tài)下的信息收集能力與內(nèi)容生成能力都卷進(jìn)來(lái)。

沿著這條路走下去,有理由相信接下來(lái)的主流AI產(chǎn)品會(huì)發(fā)生這樣的變化:

1.類似Sora的視頻生成能力,將很快融合到主流通用模型中。讓AI應(yīng)用能夠同時(shí)聽(tīng)、看、讀,并且能夠生成包括文字、代碼、音頻、圖片、視頻在內(nèi)的種種內(nèi)容。

2.垂直類的AI模型生存空間會(huì)越來(lái)越小,通用模型集成的能力不斷增多。就像GPT-4o里的“o”是Omni全能的意思。全能,將是AI產(chǎn)品主要的發(fā)展方式。

3.AI的記憶能力會(huì)越來(lái)越強(qiáng),從而導(dǎo)致“全能+定制化”成為AI應(yīng)用的主要發(fā)展思路。

雖然在目前階段,大模型在很多時(shí)候還是為了與搜索、繪圖、語(yǔ)音助手等能力結(jié)合。但隨著全模態(tài)感知,全模態(tài)理解,全模態(tài)生成的“三全大模型產(chǎn)品”不斷發(fā)展,大模型將不再是一種賦能技術(shù),而是更傾向成為獨(dú)立且全新的產(chǎn)品形態(tài)。

這個(gè)產(chǎn)品方向雖然還不成熟,但方向的確定卻意義重大。

類“視頻電話”的AI應(yīng)用,可能是除了機(jī)器人管家之外,人類對(duì)AI的最根本想象。它的出現(xiàn)和發(fā)展,意味著AI時(shí)代最大的一座海底金礦正浮出水面。

ChatGPT應(yīng)用的集體舞

如果大模型是一支足球隊(duì),OpenAI這樣的公司在前場(chǎng)進(jìn)行突破,那么更多的AI公司、科技公司則需要在中場(chǎng)進(jìn)行競(jìng)爭(zhēng)。在ChatGPT爆火之后,OpenAI開(kāi)始在智能體、文生視頻模型、全模態(tài)模型等領(lǐng)域發(fā)展,但大量借著這個(gè)機(jī)會(huì)入局大模型的公司,則更多是在打磨自己的類ChatGPT應(yīng)用。經(jīng)歷了漫長(zhǎng)的內(nèi)測(cè)之后,如今大量聊天對(duì)話框模式的AIGC應(yīng)用走向公眾。這時(shí)候問(wèn)題來(lái)了,投入了這么多,也終于可以面向C端用戶開(kāi)放了,如此費(fèi)勁,最后要怎么賺錢(qián)呢?

于是我們正在目睹非常奇特的一幕:以國(guó)產(chǎn)大模型陣營(yíng)為代表的大量AI項(xiàng)目,都集中在了類ChatGPT模式這個(gè)環(huán)節(jié)上。向前走的文生視頻等應(yīng)用還沒(méi)有完成研發(fā),而環(huán)顧左右則會(huì)發(fā)現(xiàn)大家的能力大同小異,動(dòng)作整齊劃一,只有概念口號(hào)是個(gè)喊個(gè)的。

無(wú)論是叫AI助手、智能平臺(tái)、智能對(duì)話還是智能搜索,本質(zhì)上這些大模型產(chǎn)品都是類ChatGPT應(yīng)用。從最早的文心一言,到通義千問(wèn)、豆包、Kimi、騰訊元寶、訊飛星火、天工,市場(chǎng)已經(jīng)充斥了太多的類似產(chǎn)品,大模型變成了一場(chǎng)貨真價(jià)實(shí)的集體舞。

有一個(gè)囚徒困境正在困擾著所有這類產(chǎn)品:想要收費(fèi)來(lái)回收研發(fā)成本,但又怕收費(fèi)引起用戶不滿,把用戶推向競(jìng)品;想要通過(guò)技術(shù)能力來(lái)實(shí)現(xiàn)差異化,但又拿不出真正具有說(shuō)服力的技術(shù)方案,于是只能在概念、名稱、噱頭上下一番功夫。

為了擺脫這個(gè)困境,類ChatGPT應(yīng)用們也找到了一些產(chǎn)品化方案,我們可以做個(gè)總結(jié):

1.開(kāi)始強(qiáng)調(diào)類GPTs模式,以智能體撬動(dòng)市場(chǎng)升級(jí)。

俗話說(shuō)得好,大模型+對(duì)話就是開(kāi)個(gè)場(chǎng),真正賣票還得看智能體??啥ㄖ苹哂袑I(yè)能力的智能體,被認(rèn)為是大模型商業(yè)化的真正歸宿。面向這個(gè)可能性,各家廠商也開(kāi)始了自己的探索,包括OpenAI打造了GPTs模式也是如此。

比如說(shuō),文心大模型已經(jīng)正式落地了智能體能力,推出了文心智能體平臺(tái);火山引擎也公布了一站式AI應(yīng)用開(kāi)發(fā)平臺(tái)扣子?;A(chǔ)的AIGC對(duì)話免費(fèi)+高階智能體收費(fèi)的產(chǎn)品模式,是接下來(lái)大模型商業(yè)化的主要考慮方向。

2.把類ChatGPT產(chǎn)品作為流量入口。

另一種類似應(yīng)用的產(chǎn)品化建設(shè)思路,是大入口+小收費(fèi)窗口的互聯(lián)網(wǎng)模式,即整體產(chǎn)品免費(fèi),但一些特定的功能可能需要開(kāi)通會(huì)員或者使用代幣。收費(fèi)功能可能相對(duì)比較專業(yè),瞄準(zhǔn)特定需求人群,或者比較新奇好玩,調(diào)動(dòng)用戶的獵奇嘗鮮心理。

這種模式的問(wèn)題在于,會(huì)把整個(gè)產(chǎn)品變得越來(lái)越復(fù)雜。用戶會(huì)有一種在玩免費(fèi)手游一樣的“被套路感”。而且整個(gè)入口的生態(tài)建設(shè)也需要更清晰的交互思路,以免用戶剛剛接觸大模型就面對(duì)非常復(fù)雜,到處都是收費(fèi)入口的交互邏輯。

3.把類ChatGPT應(yīng)用與自身優(yōu)勢(shì)結(jié)合。

第三種相關(guān)產(chǎn)品的建設(shè)方案,是結(jié)合這些平臺(tái)類企業(yè)其他的優(yōu)勢(shì)項(xiàng)目,從而期望達(dá)到1+1>2的效果,至少要將一部分原有平臺(tái)的用戶綁定到大模型應(yīng)用上。比如百度就強(qiáng)調(diào)將搜索、文庫(kù)、網(wǎng)盤(pán)等應(yīng)用與大模型結(jié)合,以各種方式調(diào)用文心大模型。騰訊元寶則宣布將與公眾號(hào)創(chuàng)作生態(tài)進(jìn)行結(jié)合,成為創(chuàng)作助手。

這種生態(tài)矩陣玩法,是互聯(lián)網(wǎng)產(chǎn)品的一貫思路,但用戶是否能夠由此產(chǎn)生與大模型應(yīng)用的粘性,是一件需要長(zhǎng)期考量的事情。

我們必須尷尬地承認(rèn),曾經(jīng)風(fēng)頭無(wú)兩的ChatGPT,也已經(jīng)在嘗鮮期過(guò)去之后漸漸淡出了用戶熱情追捧的區(qū)間。用戶更希望看到的是非常生動(dòng)、好玩,能夠引發(fā)流行趨勢(shì)的AI應(yīng)用,而不僅僅是生硬的對(duì)話框。

類ChatGPT應(yīng)用真正的產(chǎn)品化春天,或許在于打破固化的AIGC對(duì)話聊天框架。把其能力抽取出來(lái),變成更具有美感與傳播力的軟件產(chǎn)品。

畢竟集體舞里能被記住的,很有可能是不按規(guī)定動(dòng)作的那一個(gè)。

擬人化的貼面舞

在這些大模型產(chǎn)品化的思路之外,還有一種思路應(yīng)該得到重視,那就是將AI產(chǎn)品進(jìn)行擬人。

不久之前,如何讓ChatGPT“越獄”搞一些奇怪事情的教程四處流竄,一些網(wǎng)友掀起了跟AI“談戀愛(ài)”的新時(shí)尚。無(wú)論我們?cè)趺丛u(píng)價(jià)這些行為,必須意識(shí)到的是,人類對(duì)AI的基礎(chǔ)想象必須是擬人化、類人化的。也就是說(shuō),我們需要AI有名字,有個(gè)性,跟人類有共同記憶,而不是冷冰冰且萬(wàn)能的對(duì)話機(jī)器。

從這個(gè)思路看,AI帶來(lái)的最大價(jià)值是情緒與情感價(jià)值。我們需要與人對(duì)話,與人分享,和他人建立聯(lián)系,但這個(gè)人可能也未必需要是真人。這種需求是客觀存在,且具有商業(yè)化潛力的。GPT-4o被指責(zé)侵權(quán)采用了明星的聲音等行為,其行為動(dòng)機(jī)都是希望AI更加擬人,能夠讓用戶產(chǎn)生與真人進(jìn)行對(duì)話的想象。

讓大模型擬人化,與用戶跳貼面舞,在接下來(lái)商業(yè)化壓力越來(lái)越大的局面下,很可能成為很多AI項(xiàng)目的重點(diǎn)選擇。

比如說(shuō),豆包大模型當(dāng)中就推出了角色扮演模型,AI會(huì)模仿不同人設(shè)、不同性格的人來(lái)與用戶進(jìn)行對(duì)話,并且可以通過(guò)智能體來(lái)自己設(shè)定聊天角色。

有人設(shè)的聊天,重點(diǎn)是多輪對(duì)話的記憶能力。這一點(diǎn)上,也有越來(lái)越多的大模型產(chǎn)品強(qiáng)調(diào)記憶能力,比如文心一言就強(qiáng)調(diào)多輪對(duì)話能力帶給用戶的沉浸體驗(yàn)角色感。

技術(shù)難度小,價(jià)值可能很大,但容易觸碰法律法規(guī)與公序良俗的邊緣地帶。大模型擬人的產(chǎn)品化空間,應(yīng)該會(huì)在未來(lái)得到越來(lái)越大的重視。由此可能輻射到的數(shù)字人主播、專屬AI助手等產(chǎn)品化形式,有著非常充裕的討論和想象空間。

大模型的產(chǎn)品化,目前整體處在一個(gè)高不成低不就的尷尬情況里。向上突破,技術(shù)代差依舊明顯,技術(shù)的未知領(lǐng)域情形不明;橫向競(jìng)爭(zhēng),同類大模型產(chǎn)品過(guò)多,已經(jīng)產(chǎn)生了讓人窒息的擠壓感;向下覆蓋,大多數(shù)互聯(lián)網(wǎng)用戶其實(shí)還對(duì)大模型應(yīng)用沒(méi)有感覺(jué),找不到使用與付費(fèi)的必要性;彎道超車,搞一些擬人項(xiàng)目,還容易觸到各種雷區(qū)。

這種情況下,大模型的產(chǎn)品化必須戴著枷鎖跳舞,既要讓觀眾看到,又要小心舞臺(tái)上的荊棘。

或許在不遠(yuǎn)的未來(lái),一個(gè)或者幾個(gè)天才般的產(chǎn)品化創(chuàng)意,將解決一切大模型的苦厄。但在今天,做大模型產(chǎn)品的主旋律依舊是賠錢(qián)賺吆喝,打腫臉充胖子。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-06-12
大模型產(chǎn)品化,不過(guò)是三支舞
大模型產(chǎn)品化,不過(guò)是三支舞

長(zhǎng)按掃碼 閱讀全文