123,123,123

大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽？聽李開復(fù)講。

1年時(shí)間、從0到1打造一家大模型創(chuàng)業(yè)企業(yè)，其中：旗艦大模型Yi-Large能力躋身全球第一梯隊(duì)、海外toC產(chǎn)品營收過億元、開源Yi-1.5系列模型、面向國內(nèi)外發(fā)布多款模型 API 接口、對標(biāo)ChatGPT5的大模型正在開發(fā)……

這是在零一萬物成立一周年時(shí)，李開復(fù)披露的成績單。

零一萬物旗艦大模型Yi-Large排名

目前零一萬物已經(jīng)構(gòu)建起“開源閉源雙軌策略”，大模型生成出來，交給 2C做產(chǎn)品，交給API平臺推動(dòng)生態(tài)的業(yè)態(tài)。

“我們狂奔了一年，在模型方面趕上美國最頂尖的大模型，以后還要繼續(xù)努力?！?/p>

李開復(fù)稱：“但是面對未來，不能只是拼命狂奔，要開始思考怎么進(jìn)入長跑模式?！?/p>

大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽？

作為國內(nèi)最早的VC創(chuàng)投基金創(chuàng)始人之一，李開復(fù)曾被譽(yù)為年輕人的創(chuàng)業(yè)導(dǎo)師，對成功孵化創(chuàng)業(yè)有著深入洞察。

現(xiàn)在，李開復(fù)把他和團(tuán)隊(duì)的經(jīng)驗(yàn)總結(jié)出“方法論”，并在零一萬物一周年時(shí)分享出來了。

選對路：「AGI」 vs 「PMF」 vs 「TC-PMF」

“國內(nèi)的初創(chuàng)公司，相對硅谷公司的差異，我們能夠仰望星空，但也能腳踏實(shí)地?！?/p>

李開復(fù)稱，目前大模型創(chuàng)業(yè)有2條路有很多討論，有一批人瘋狂地追AGI（Artificial General Intelligence，通用人工智能），認(rèn)為AGI一旦發(fā)生世界都改變了，另外一批人會說模型做得越大越難用，還不如趕快找到PMF（適合市場需求的應(yīng)用）。

/注：PMF（Product Market Fit），指“產(chǎn)品市場匹配度”。硅谷著名風(fēng)險(xiǎn)投資家、網(wǎng)景公司創(chuàng)始人馬克·安德森（Marc Andreessen）最早提出了這個(gè)概念，指出了產(chǎn)品市場匹配度的重要性，你所提供的產(chǎn)品正好滿足市場的需求，令客戶滿意，這是創(chuàng)業(yè)成功的第一步。/

對此，李開復(fù)認(rèn)為：“這兩批人說得都對，但都不完整”。

AGI是夢想，但是你用夢想去指點(diǎn)一個(gè)公司的執(zhí)行，而你又沒有財(cái)力去做超級大力出奇跡的事情，那其實(shí)就是徒勞無功的。

零一萬物是務(wù)實(shí)的AGI信仰者，不會用純大力出奇跡的唯一思維，追求能不能用一百億美金、一千億美金去訓(xùn)練出最好的大模型。Open AI有資格嘗試這條道路，但這不是我們走的道路。我們是務(wù)實(shí)，我們一定要用最少的芯片，最低的成本訓(xùn)練出我們能訓(xùn)練最好的模型。

李開復(fù)也強(qiáng)調(diào)，不覺得有任何一種技術(shù)可以在長期的時(shí)間里只靠技術(shù)領(lǐng)跑所有的競爭，一定是最終產(chǎn)品的勝出要靠非技術(shù)的優(yōu)勢達(dá)到口碑的傳播。

“今天我們不能忘記PMF的重要性，做所有的產(chǎn)品都應(yīng)該基于PMF，不是胡亂去燒錢，但有了PMF這個(gè)理論是不夠的”，李開復(fù)表示：“我們提出除了PMF之外AI2.0時(shí)代還要考慮TC-PMF，T代表Technology（技術(shù)），C代表Cost（成本）?！?/p>

之所以要加上“T”和“C”，李開復(fù)認(rèn)為，考慮Technology，是因?yàn)榇竽Ｐ腿匀话凑誗caling laws(尺度定律)在快速進(jìn)化，要不斷預(yù)測未來技術(shù)會怎么走，而不是基于今天的技術(shù)來決定能做什么。

/注：大模型的Scaling Law是OpenAI在2020年提出的概念，即模型的最終性能主要與計(jì)算量，模型參數(shù)量和數(shù)據(jù)大小三者相關(guān)，而與模型的具體結(jié)構(gòu)(層數(shù)/深度/寬度)基本無關(guān)。/

考慮Cost，是因?yàn)楝F(xiàn)在大模型推理成本過高，很多用戶規(guī)模大的應(yīng)用還不能全面嵌入AI。例如，今天如果開發(fā)一個(gè)社交應(yīng)用，每次跟人聊天統(tǒng)統(tǒng)都要調(diào)用API幫你畫各種東西，最后這個(gè)API的成本會讓創(chuàng)業(yè)企業(yè)破產(chǎn)。因此要努力將大模型推理成本降下來。

李開復(fù)表示，整個(gè)行業(yè)應(yīng)該用更務(wù)實(shí)的方法，一方面做一個(gè)務(wù)實(shí)的AGI的信仰者，另一方面要?jiǎng)?wù)實(shí)地把模型尺寸壓縮下來，把推理成本降低下來，零一萬物在做的是能不能加速比別人的成本更降一步。

“考慮到做一個(gè)偉大的大模型公司，不只是底層，同樣重要的還有應(yīng)用，怎么找到復(fù)雜的TC-PMF，怎么把這一批完全不同的人聚在一起協(xié)作，這是我們在硅谷公司一般沒有看到，這是我們獨(dú)特的方法，也是中國獨(dú)角獸的機(jī)會?！崩铋_復(fù)強(qiáng)調(diào)。

闡述上述方法論后，李開復(fù)還攜一眾團(tuán)隊(duì)大拿，分享了零一萬物的實(shí)際操作經(jīng)驗(yàn)。

零一萬物的4大發(fā)展原則

1、全球布局：模型、產(chǎn)品都面對全球，平行跟跑

一年前開始時(shí)，美國全方位領(lǐng)先，我們要謙卑地跟人家學(xué)習(xí)，人家有好的已經(jīng)被教育的市場里，看在這個(gè)市場里怎么達(dá)到TC-PMF。

去年9月開始，零一萬物便聚焦生產(chǎn)力、社交賽道于海外應(yīng)用展開探索，已有 4 款產(chǎn)品陸續(xù)上線。目前零一萬物海外生產(chǎn)力應(yīng)用總用戶接近千萬，海外產(chǎn)品采用會員訂閱制，營收今年預(yù)期過億人民幣。

李開復(fù)強(qiáng)調(diào)了成功的經(jīng)驗(yàn)：“我們平行的在跟跑”。

零一萬物創(chuàng)業(yè)的前三個(gè)月招了一批優(yōu)秀的產(chǎn)品負(fù)責(zé)人，先去最先進(jìn)的國外市場，用當(dāng)時(shí)最先進(jìn)的模型GPT-4調(diào)優(yōu)當(dāng)時(shí)所有的PMF，調(diào)到了國外的PMF。與此同時(shí)，幾個(gè)月間零一萬物國內(nèi)的模型也訓(xùn)練出來了，在國內(nèi)會把整個(gè)應(yīng)用后端切換到自己的模型上。“在國內(nèi)能夠幫助我們打造更好的模型和用戶體驗(yàn)”。

5月初，零一萬物在國內(nèi)推出“萬知”的，這款產(chǎn)品就是在零一萬物團(tuán)隊(duì)在海外已經(jīng)驗(yàn)證成功達(dá)到PMF的產(chǎn)品再推回中國的例子。

現(xiàn)在還在2B方面探索和世界500強(qiáng)達(dá)到深度的合作，我們看到美國的一些公司做了行業(yè)的金融大模型，但并不是特別地滿意，我們認(rèn)為我們可以和世界500強(qiáng)達(dá)成獨(dú)特的合作，讓它深度合作參與達(dá)到雙贏。

2、模基共建：特別重要，目的是省算力、省成本

“我們今天面臨一個(gè)現(xiàn)實(shí)，就是美國大廠的GPU數(shù)量，是中國任何公司、尤其是初創(chuàng)公司的十倍以上。在這個(gè)前提之下，我們要怎樣才能確保能緊追世界領(lǐng)先的公司，哪怕追上了它現(xiàn)在的產(chǎn)品，它還會有下一個(gè)產(chǎn)品的發(fā)布?！?/p>

“既然不能用10萬張GPU來訓(xùn)練，我們就會尋找別的方式，依然能做出非常好的效果?！?/p>

用有限的資源來打造一個(gè)能緊追對手的方法論。在GPU算力稀缺的情況下，只能竭盡全力的提高計(jì)算效率。要特別重視 AI Infra。

AI Infra（AI Infrastructure 人工智能基礎(chǔ)架構(gòu)技術(shù)），它涵蓋了人工智能開發(fā)和部署所需的各種底層技術(shù)設(shè)施。這些設(shè)施包括處理器、操作系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計(jì)算平臺等，它們共同構(gòu)成了大模型訓(xùn)練和部署的硬技術(shù)基礎(chǔ)。AI Infra可以被視為連接算力和應(yīng)用的中間層基礎(chǔ)設(shè)施。

零一萬物的模型團(tuán)隊(duì)和Infra架構(gòu)團(tuán)隊(duì)會在一起工作，“這個(gè)特別重要”，李開復(fù)強(qiáng)調(diào)。這也就是“模基共建”。

據(jù)介紹，零一萬物的大模型和Infra團(tuán)隊(duì)有1比1規(guī)模。

零一萬物模型訓(xùn)練負(fù)責(zé)人黃文灝補(bǔ)充道，算法和Infra要一體優(yōu)化，算法人員會往Infra下面看很多，Infra人員會往算法上看很多，我們最后直接并成一個(gè)團(tuán)隊(duì)，這樣我們可以用 One Team 的工作方式來推進(jìn)。

黃文灝強(qiáng)調(diào)，要關(guān)注計(jì)算效率，它是算法和Infra做聯(lián)合優(yōu)化的問題，算法人員應(yīng)該看到很底層的Infra，怎么提高GPU使用率和GPU之間通信的問題，而不是像過去用別人現(xiàn)有的庫調(diào)優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)，這里面的范式有很大不一樣。零一萬物所有算法人員都可以寫到底層的CUDA算子（注：CUDA是NVIDIA在2006年推出的運(yùn)算平臺），通信算子，這些都是必備的能力。

李開復(fù)曾經(jīng)表示，“做過大模型 Infra 的人比做算法的人才更稀缺”。超強(qiáng)的Infra能力是大模型研發(fā)的核心護(hù)城河之一。現(xiàn)在，李開復(fù)稱，重視Infra給零一萬物帶來絕對的大模型訓(xùn)練成本優(yōu)勢。

3、模應(yīng)一體：不是只做酷炫的 demo，對用戶有價(jià)值，這才是價(jià)值

所謂模應(yīng)一體，即模型和應(yīng)用一體。

如何做到模應(yīng)一體？

“零一萬物有比較多的應(yīng)用在做，包括生產(chǎn)力、社交、娛樂，我們希望所有的應(yīng)用都基于一個(gè)通用的模型。這個(gè)預(yù)訓(xùn)練模型作為一個(gè)基礎(chǔ)可以服務(wù)所有的應(yīng)用。”黃文灝介紹。

“我們打破壁壘，算法團(tuán)隊(duì)和應(yīng)用團(tuán)隊(duì)是一體化。一方面以應(yīng)用為目標(biāo)的產(chǎn)品經(jīng)理要不斷去了解基礎(chǔ)，哪些是模型能做的，哪些是模型不能做的，一定要了解產(chǎn)品的邊界在哪里。另一方面技術(shù)人員也要去了解產(chǎn)品的需求到底是什么，找到一個(gè)實(shí)際的應(yīng)用和模型能夠快速一體化迭代的方案?！?/p>

零一萬物生產(chǎn)力產(chǎn)品負(fù)責(zé)人曹大鵬介紹，萬知和零一萬物海外的產(chǎn)品，都是在“模應(yīng)一體”的組織下打造出來。海外產(chǎn)品的ROI（投資回報(bào)率）達(dá)到1以上。

為什么要“模應(yīng)一體”，曹大鵬認(rèn)為，本身模型在不斷提升，模型提升之后，在原來模型基礎(chǔ)上做的應(yīng)用是不是沒有價(jià)值了？這要求產(chǎn)品跟模型要深度預(yù)判技術(shù)趨勢，在模型最開始階段或者定義的時(shí)候，就把應(yīng)用思考融入進(jìn)去。

另外，曹大鵬也分享了零一萬物從0到1打造一個(gè)應(yīng)用產(chǎn)品的關(guān)注點(diǎn)，”我們實(shí)踐下來，在0到0.1早期的時(shí)候，最核心的產(chǎn)品方法論就是TC-PMF。0到0.1最重要的是怎么讓產(chǎn)品能夠讓用戶使用。0到1我們最關(guān)注產(chǎn)品長期留存，包括能不能產(chǎn)生用戶自傳播的口碑。從1到100的過程需要規(guī)模化增長能力，怎么把ROI做到1以上?！?/p>

4、AI-First應(yīng)用：找到”普惠點(diǎn)“，才能爆發(fā)

李開復(fù)認(rèn)為，現(xiàn)在對于所有大模型公司的考驗(yàn)，在復(fù)雜的TC-PMF環(huán)境之下，怎樣同時(shí)開發(fā)產(chǎn)品、了解用戶和市場，又考慮到技術(shù)的發(fā)展速度和模型的合理推進(jìn)，還要考慮推理成本的必然下降……怎么結(jié)合起來在它發(fā)生的那一點(diǎn)，我們可以稱之為“普惠點(diǎn)”，開發(fā)出最好的AI-First應(yīng)用。

“只有達(dá)到普惠，模型成本不會成為做一個(gè)海量體量產(chǎn)品的障礙，這樣的popular app才有可能發(fā)生”，曹大鵬進(jìn)一步舉例道：“抖音真正變成一個(gè)Super app是在蘋果手機(jī)推出幾年之后，抖音產(chǎn)生Super app的時(shí)間點(diǎn)，第一個(gè)是4G普及，第二個(gè)是安卓千元機(jī)的普及，一下子把短視頻的市場擴(kuò)大100倍?！?/p>

零一萬物一直在努力降低模型使用成本。零一萬物API開放平臺的負(fù)責(zé)人藍(lán)雨川介紹，Yi-Large API現(xiàn)在定價(jià)是20元人民幣，對應(yīng)100萬token數(shù)量。這個(gè)數(shù)字大概是GPT-4定價(jià)的不到1/3。

李開復(fù)稱：“人類的需求是固定的，需要工作、娛樂、溝通、社交、電商、購買，這些需求什么時(shí)候才能有AI-Frist應(yīng)用出來？這個(gè)真實(shí)帶來的價(jià)值就是誰會打造一個(gè)AI抖音，AI微信，AI淘寶，我們希望我們有可能作為這樣一個(gè)點(diǎn)燃者。如果我們不能做到，希望一個(gè)很好的開發(fā)者，能用我們的API做到。”（果青）

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）