大佬說(shuō)AI|李開(kāi)復(fù)親授“從0到1大模型創(chuàng)業(yè)”方法論 別胡亂燒錢(qián)

大模型創(chuàng)業(yè)公司該用什么姿勢(shì)開(kāi)啟長(zhǎng)跑拉力賽?聽(tīng)李開(kāi)復(fù)講。

1年時(shí)間、從0到1打造一家大模型創(chuàng)業(yè)企業(yè),其中:旗艦大模型Yi-Large能力躋身全球第一梯隊(duì)、海外toC產(chǎn)品營(yíng)收過(guò)億元、開(kāi)源Yi-1.5系列模型、面向國(guó)內(nèi)外發(fā)布多款模型 API 接口、對(duì)標(biāo)ChatGPT5的大模型正在開(kāi)發(fā)……

這是在零一萬(wàn)物成立一周年時(shí),李開(kāi)復(fù)披露的成績(jī)單。

零一萬(wàn)物旗艦大模型Yi-Large排名

目前零一萬(wàn)物已經(jīng)構(gòu)建起“開(kāi)源閉源雙軌策略”,大模型生成出來(lái),交給 2C做產(chǎn)品,交給API平臺(tái)推動(dòng)生態(tài)的業(yè)態(tài)。

“我們狂奔了一年,在模型方面趕上美國(guó)最頂尖的大模型,以后還要繼續(xù)努力?!?/p>

李開(kāi)復(fù)稱:“但是面對(duì)未來(lái),不能只是拼命狂奔,要開(kāi)始思考怎么進(jìn)入長(zhǎng)跑模式?!?/p>

大模型創(chuàng)業(yè)公司該用什么姿勢(shì)開(kāi)啟長(zhǎng)跑拉力賽?

作為國(guó)內(nèi)最早的VC創(chuàng)投基金創(chuàng)始人之一,李開(kāi)復(fù)曾被譽(yù)為年輕人的創(chuàng)業(yè)導(dǎo)師,對(duì)成功孵化創(chuàng)業(yè)有著深入洞察。

現(xiàn)在,李開(kāi)復(fù)把他和團(tuán)隊(duì)的經(jīng)驗(yàn)總結(jié)出“方法論”,并在零一萬(wàn)物一周年時(shí)分享出來(lái)了。

選對(duì)路:「AGI」 vs 「PMF」 vs 「TC-PMF」

“國(guó)內(nèi)的初創(chuàng)公司,相對(duì)硅谷公司的差異,我們能夠仰望星空,但也能腳踏實(shí)地?!?/p>

李開(kāi)復(fù)稱,目前大模型創(chuàng)業(yè)有2條路有很多討論,有一批人瘋狂地追AGI(Artificial General Intelligence,通用人工智能),認(rèn)為AGI一旦發(fā)生世界都改變了,另外一批人會(huì)說(shuō)模型做得越大越難用,還不如趕快找到PMF(適合市場(chǎng)需求的應(yīng)用)。

/注:PMF(Product Market Fit),指“產(chǎn)品市場(chǎng)匹配度”。硅谷著名風(fēng)險(xiǎn)投資家、網(wǎng)景公司創(chuàng)始人馬克·安德森(Marc Andreessen)最早提出了這個(gè)概念,指出了產(chǎn)品市場(chǎng)匹配度的重要性,你所提供的產(chǎn)品正好滿足市場(chǎng)的需求,令客戶滿意,這是創(chuàng)業(yè)成功的第一步。/

對(duì)此,李開(kāi)復(fù)認(rèn)為:“這兩批人說(shuō)得都對(duì),但都不完整”。

AGI是夢(mèng)想,但是你用夢(mèng)想去指點(diǎn)一個(gè)公司的執(zhí)行,而你又沒(méi)有財(cái)力去做超級(jí)大力出奇跡的事情,那其實(shí)就是徒勞無(wú)功的。

零一萬(wàn)物是務(wù)實(shí)的AGI信仰者,不會(huì)用純大力出奇跡的唯一思維,追求能不能用一百億美金、一千億美金去訓(xùn)練出最好的大模型。Open AI有資格嘗試這條道路,但這不是我們走的道路。我們是務(wù)實(shí),我們一定要用最少的芯片,最低的成本訓(xùn)練出我們能訓(xùn)練最好的模型。

李開(kāi)復(fù)也強(qiáng)調(diào),不覺(jué)得有任何一種技術(shù)可以在長(zhǎng)期的時(shí)間里只靠技術(shù)領(lǐng)跑所有的競(jìng)爭(zhēng),一定是最終產(chǎn)品的勝出要靠非技術(shù)的優(yōu)勢(shì)達(dá)到口碑的傳播。

“今天我們不能忘記PMF的重要性,做所有的產(chǎn)品都應(yīng)該基于PMF,不是胡亂去燒錢(qián),但有了PMF這個(gè)理論是不夠的”,李開(kāi)復(fù)表示:“我們提出除了PMF之外AI2.0時(shí)代還要考慮TC-PMF,T代表Technology(技術(shù)),C代表Cost(成本)?!?/p>

之所以要加上“T”和“C”,李開(kāi)復(fù)認(rèn)為,考慮Technology,是因?yàn)榇竽P腿匀话凑誗caling laws(尺度定律)在快速進(jìn)化,要不斷預(yù)測(cè)未來(lái)技術(shù)會(huì)怎么走,而不是基于今天的技術(shù)來(lái)決定能做什么。

/注:大模型的Scaling Law是OpenAI在2020年提出的概念,即模型的最終性能主要與計(jì)算量,模型參數(shù)量和數(shù)據(jù)大小三者相關(guān),而與模型的具體結(jié)構(gòu)(層數(shù)/深度/寬度)基本無(wú)關(guān)。/

考慮Cost,是因?yàn)楝F(xiàn)在大模型推理成本過(guò)高,很多用戶規(guī)模大的應(yīng)用還不能全面嵌入AI。例如,今天如果開(kāi)發(fā)一個(gè)社交應(yīng)用,每次跟人聊天統(tǒng)統(tǒng)都要調(diào)用API幫你畫(huà)各種東西,最后這個(gè)API的成本會(huì)讓創(chuàng)業(yè)企業(yè)破產(chǎn)。因此要努力將大模型推理成本降下來(lái)。

李開(kāi)復(fù)表示,整個(gè)行業(yè)應(yīng)該用更務(wù)實(shí)的方法,一方面做一個(gè)務(wù)實(shí)的AGI的信仰者,另一方面要?jiǎng)?wù)實(shí)地把模型尺寸壓縮下來(lái),把推理成本降低下來(lái),零一萬(wàn)物在做的是能不能加速比別人的成本更降一步。

“考慮到做一個(gè)偉大的大模型公司,不只是底層,同樣重要的還有應(yīng)用,怎么找到復(fù)雜的TC-PMF,怎么把這一批完全不同的人聚在一起協(xié)作,這是我們?cè)诠韫裙疽话銢](méi)有看到,這是我們獨(dú)特的方法,也是中國(guó)獨(dú)角獸的機(jī)會(huì)?!崩铋_(kāi)復(fù)強(qiáng)調(diào)。

闡述上述方法論后,李開(kāi)復(fù)還攜一眾團(tuán)隊(duì)大拿,分享了零一萬(wàn)物的實(shí)際操作經(jīng)驗(yàn)。

零一萬(wàn)物的4大發(fā)展原則

1、全球布局:模型、產(chǎn)品都面對(duì)全球,平行跟跑

一年前開(kāi)始時(shí),美國(guó)全方位領(lǐng)先,我們要謙卑地跟人家學(xué)習(xí),人家有好的已經(jīng)被教育的市場(chǎng)里,看在這個(gè)市場(chǎng)里怎么達(dá)到TC-PMF。

去年9月開(kāi)始,零一萬(wàn)物便聚焦生產(chǎn)力、社交賽道于海外應(yīng)用展開(kāi)探索,已有 4 款產(chǎn)品陸續(xù)上線。目前零一萬(wàn)物海外生產(chǎn)力應(yīng)用總用戶接近千萬(wàn),海外產(chǎn)品采用會(huì)員訂閱制,營(yíng)收今年預(yù)期過(guò)億人民幣。

李開(kāi)復(fù)強(qiáng)調(diào)了成功的經(jīng)驗(yàn):“我們平行的在跟跑”。

零一萬(wàn)物創(chuàng)業(yè)的前三個(gè)月招了一批優(yōu)秀的產(chǎn)品負(fù)責(zé)人,先去最先進(jìn)的國(guó)外市場(chǎng),用當(dāng)時(shí)最先進(jìn)的模型GPT-4調(diào)優(yōu)當(dāng)時(shí)所有的PMF,調(diào)到了國(guó)外的PMF。與此同時(shí),幾個(gè)月間零一萬(wàn)物國(guó)內(nèi)的模型也訓(xùn)練出來(lái)了,在國(guó)內(nèi)會(huì)把整個(gè)應(yīng)用后端切換到自己的模型上?!霸趪?guó)內(nèi)能夠幫助我們打造更好的模型和用戶體驗(yàn)”。

5月初,零一萬(wàn)物在國(guó)內(nèi)推出“萬(wàn)知”的,這款產(chǎn)品就是在零一萬(wàn)物團(tuán)隊(duì)在海外已經(jīng)驗(yàn)證成功達(dá)到PMF的產(chǎn)品再推回中國(guó)的例子。

現(xiàn)在還在2B方面探索和世界500強(qiáng)達(dá)到深度的合作,我們看到美國(guó)的一些公司做了行業(yè)的金融大模型,但并不是特別地滿意,我們認(rèn)為我們可以和世界500強(qiáng)達(dá)成獨(dú)特的合作,讓它深度合作參與達(dá)到雙贏。

2、?;步ǎ?/strong>特別重要,目的是省算力、省成本

“我們今天面臨一個(gè)現(xiàn)實(shí),就是美國(guó)大廠的GPU數(shù)量,是中國(guó)任何公司、尤其是初創(chuàng)公司的十倍以上。在這個(gè)前提之下,我們要怎樣才能確保能緊追世界領(lǐng)先的公司,哪怕追上了它現(xiàn)在的產(chǎn)品,它還會(huì)有下一個(gè)產(chǎn)品的發(fā)布?!?/p>

“既然不能用10萬(wàn)張GPU來(lái)訓(xùn)練,我們就會(huì)尋找別的方式,依然能做出非常好的效果?!?/p>

用有限的資源來(lái)打造一個(gè)能緊追對(duì)手的方法論。在GPU算力稀缺的情況下,只能竭盡全力的提高計(jì)算效率。要特別重視 AI Infra。

AI Infra(AI Infrastructure 人工智能基礎(chǔ)架構(gòu)技術(shù)),它涵蓋了人工智能開(kāi)發(fā)和部署所需的各種底層技術(shù)設(shè)施。這些設(shè)施包括處理器、操作系統(tǒng)、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計(jì)算平臺(tái)等,它們共同構(gòu)成了大模型訓(xùn)練和部署的硬技術(shù)基礎(chǔ)。AI Infra可以被視為連接算力和應(yīng)用的中間層基礎(chǔ)設(shè)施。

零一萬(wàn)物的模型團(tuán)隊(duì)和Infra架構(gòu)團(tuán)隊(duì)會(huì)在一起工作,“這個(gè)特別重要”,李開(kāi)復(fù)強(qiáng)調(diào)。這也就是“?;步ā?。

據(jù)介紹,零一萬(wàn)物的大模型和Infra團(tuán)隊(duì)有1比1規(guī)模。

零一萬(wàn)物模型訓(xùn)練負(fù)責(zé)人黃文灝補(bǔ)充道,算法和Infra要一體優(yōu)化,算法人員會(huì)往Infra下面看很多,Infra人員會(huì)往算法上看很多,我們最后直接并成一個(gè)團(tuán)隊(duì),這樣我們可以用 One Team 的工作方式來(lái)推進(jìn)。

黃文灝強(qiáng)調(diào),要關(guān)注計(jì)算效率,它是算法和Infra做聯(lián)合優(yōu)化的問(wèn)題,算法人員應(yīng)該看到很底層的Infra,怎么提高GPU使用率和GPU之間通信的問(wèn)題,而不是像過(guò)去用別人現(xiàn)有的庫(kù)調(diào)優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),這里面的范式有很大不一樣。零一萬(wàn)物所有算法人員都可以寫(xiě)到底層的CUDA算子(注:CUDA是NVIDIA在2006年推出的運(yùn)算平臺(tái)),通信算子,這些都是必備的能力。

李開(kāi)復(fù)曾經(jīng)表示,“做過(guò)大模型 Infra 的人比做算法的人才更稀缺”。超強(qiáng)的Infra能力是大模型研發(fā)的核心護(hù)城河之一。現(xiàn)在,李開(kāi)復(fù)稱,重視Infra給零一萬(wàn)物帶來(lái)絕對(duì)的大模型訓(xùn)練成本優(yōu)勢(shì)。

3、模應(yīng)一體:不是只做酷炫的 demo,對(duì)用戶有價(jià)值,這才是價(jià)值

所謂模應(yīng)一體,即模型和應(yīng)用一體。

如何做到模應(yīng)一體?

“零一萬(wàn)物有比較多的應(yīng)用在做,包括生產(chǎn)力、社交、娛樂(lè),我們希望所有的應(yīng)用都基于一個(gè)通用的模型。這個(gè)預(yù)訓(xùn)練模型作為一個(gè)基礎(chǔ)可以服務(wù)所有的應(yīng)用?!秉S文灝介紹。

“我們打破壁壘,算法團(tuán)隊(duì)和應(yīng)用團(tuán)隊(duì)是一體化。一方面以應(yīng)用為目標(biāo)的產(chǎn)品經(jīng)理要不斷去了解基礎(chǔ),哪些是模型能做的,哪些是模型不能做的,一定要了解產(chǎn)品的邊界在哪里。另一方面技術(shù)人員也要去了解產(chǎn)品的需求到底是什么,找到一個(gè)實(shí)際的應(yīng)用和模型能夠快速一體化迭代的方案。”

零一萬(wàn)物生產(chǎn)力產(chǎn)品負(fù)責(zé)人曹大鵬介紹,萬(wàn)知和零一萬(wàn)物海外的產(chǎn)品,都是在“模應(yīng)一體”的組織下打造出來(lái)。海外產(chǎn)品的ROI(投資回報(bào)率)達(dá)到1以上。

為什么要“模應(yīng)一體”,曹大鵬認(rèn)為,本身模型在不斷提升,模型提升之后,在原來(lái)模型基礎(chǔ)上做的應(yīng)用是不是沒(méi)有價(jià)值了?這要求產(chǎn)品跟模型要深度預(yù)判技術(shù)趨勢(shì),在模型最開(kāi)始階段或者定義的時(shí)候,就把應(yīng)用思考融入進(jìn)去。

另外,曹大鵬也分享了零一萬(wàn)物從0到1打造一個(gè)應(yīng)用產(chǎn)品的關(guān)注點(diǎn),”我們實(shí)踐下來(lái),在0到0.1早期的時(shí)候,最核心的產(chǎn)品方法論就是TC-PMF。0到0.1最重要的是怎么讓產(chǎn)品能夠讓用戶使用。0到1我們最關(guān)注產(chǎn)品長(zhǎng)期留存,包括能不能產(chǎn)生用戶自傳播的口碑。從1到100的過(guò)程需要規(guī)模化增長(zhǎng)能力,怎么把ROI做到1以上?!?/p>

4、AI-First應(yīng)用:找到”普惠點(diǎn)“,才能爆發(fā)

李開(kāi)復(fù)認(rèn)為,現(xiàn)在對(duì)于所有大模型公司的考驗(yàn),在復(fù)雜的TC-PMF環(huán)境之下,怎樣同時(shí)開(kāi)發(fā)產(chǎn)品、了解用戶和市場(chǎng),又考慮到技術(shù)的發(fā)展速度和模型的合理推進(jìn),還要考慮推理成本的必然下降……怎么結(jié)合起來(lái)在它發(fā)生的那一點(diǎn),我們可以稱之為“普惠點(diǎn)”,開(kāi)發(fā)出最好的AI-First應(yīng)用。

“只有達(dá)到普惠,模型成本不會(huì)成為做一個(gè)海量體量產(chǎn)品的障礙,這樣的popular app才有可能發(fā)生”,曹大鵬進(jìn)一步舉例道:“抖音真正變成一個(gè)Super app是在蘋(píng)果手機(jī)推出幾年之后,抖音產(chǎn)生Super app的時(shí)間點(diǎn),第一個(gè)是4G普及,第二個(gè)是安卓千元機(jī)的普及,一下子把短視頻的市場(chǎng)擴(kuò)大100倍?!?/p>

零一萬(wàn)物一直在努力降低模型使用成本。零一萬(wàn)物API開(kāi)放平臺(tái)的負(fù)責(zé)人藍(lán)雨川介紹,Yi-Large API現(xiàn)在定價(jià)是20元人民幣,對(duì)應(yīng)100萬(wàn)token數(shù)量。這個(gè)數(shù)字大概是GPT-4定價(jià)的不到1/3。

李開(kāi)復(fù)稱:“人類(lèi)的需求是固定的,需要工作、娛樂(lè)、溝通、社交、電商、購(gòu)買(mǎi),這些需求什么時(shí)候才能有AI-Frist應(yīng)用出來(lái)?這個(gè)真實(shí)帶來(lái)的價(jià)值就是誰(shuí)會(huì)打造一個(gè)AI抖音,AI微信,AI淘寶,我們希望我們有可能作為這樣一個(gè)點(diǎn)燃者。如果我們不能做到,希望一個(gè)很好的開(kāi)發(fā)者,能用我們的API做到?!保ü啵?/p>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2024-05-17
大佬說(shuō)AI|李開(kāi)復(fù)親授“從0到1大模型創(chuàng)業(yè)”方法論 別胡亂燒錢(qián)
大模型創(chuàng)業(yè)公司該用什么姿勢(shì)開(kāi)啟長(zhǎng)跑拉力賽?聽(tīng)李開(kāi)復(fù)講。

長(zhǎng)按掃碼 閱讀全文