大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?聽李開復講。
1年時間、從0到1打造一家大模型創(chuàng)業(yè)企業(yè),其中:旗艦大模型Yi-Large能力躋身全球第一梯隊、海外toC產(chǎn)品營收過億元、開源Yi-1.5系列模型、面向國內(nèi)外發(fā)布多款模型 API 接口、對標ChatGPT5的大模型正在開發(fā)……
這是在零一萬物成立一周年時,李開復披露的成績單。
零一萬物旗艦大模型Yi-Large排名
目前零一萬物已經(jīng)構(gòu)建起“開源閉源雙軌策略”,大模型生成出來,交給 2C做產(chǎn)品,交給API平臺推動生態(tài)的業(yè)態(tài)。
“我們狂奔了一年,在模型方面趕上美國最頂尖的大模型,以后還要繼續(xù)努力?!?/p>
李開復稱:“但是面對未來,不能只是拼命狂奔,要開始思考怎么進入長跑模式?!?/p>
大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?
作為國內(nèi)最早的VC創(chuàng)投基金創(chuàng)始人之一,李開復曾被譽為年輕人的創(chuàng)業(yè)導師,對成功孵化創(chuàng)業(yè)有著深入洞察。
現(xiàn)在,李開復把他和團隊的經(jīng)驗總結(jié)出“方法論”,并在零一萬物一周年時分享出來了。
選對路:「AGI」 vs 「PMF」 vs 「TC-PMF」
“國內(nèi)的初創(chuàng)公司,相對硅谷公司的差異,我們能夠仰望星空,但也能腳踏實地。”
李開復稱,目前大模型創(chuàng)業(yè)有2條路有很多討論,有一批人瘋狂地追AGI(Artificial General Intelligence,通用人工智能),認為AGI一旦發(fā)生世界都改變了,另外一批人會說模型做得越大越難用,還不如趕快找到PMF(適合市場需求的應用)。
/注:PMF(Product Market Fit),指“產(chǎn)品市場匹配度”。硅谷著名風險投資家、網(wǎng)景公司創(chuàng)始人馬克·安德森(Marc Andreessen)最早提出了這個概念,指出了產(chǎn)品市場匹配度的重要性,你所提供的產(chǎn)品正好滿足市場的需求,令客戶滿意,這是創(chuàng)業(yè)成功的第一步。/
對此,李開復認為:“這兩批人說得都對,但都不完整”。
AGI是夢想,但是你用夢想去指點一個公司的執(zhí)行,而你又沒有財力去做超級大力出奇跡的事情,那其實就是徒勞無功的。
零一萬物是務實的AGI信仰者,不會用純大力出奇跡的唯一思維,追求能不能用一百億美金、一千億美金去訓練出最好的大模型。Open AI有資格嘗試這條道路,但這不是我們走的道路。我們是務實,我們一定要用最少的芯片,最低的成本訓練出我們能訓練最好的模型。
李開復也強調(diào),不覺得有任何一種技術(shù)可以在長期的時間里只靠技術(shù)領(lǐng)跑所有的競爭,一定是最終產(chǎn)品的勝出要靠非技術(shù)的優(yōu)勢達到口碑的傳播。
“今天我們不能忘記PMF的重要性,做所有的產(chǎn)品都應該基于PMF,不是胡亂去燒錢,但有了PMF這個理論是不夠的”,李開復表示:“我們提出除了PMF之外AI2.0時代還要考慮TC-PMF,T代表Technology(技術(shù)),C代表Cost(成本)?!?/p>
之所以要加上“T”和“C”,李開復認為,考慮Technology,是因為大模型仍然按照Scaling laws(尺度定律)在快速進化,要不斷預測未來技術(shù)會怎么走,而不是基于今天的技術(shù)來決定能做什么。
/注:大模型的Scaling Law是OpenAI在2020年提出的概念,即模型的最終性能主要與計算量,模型參數(shù)量和數(shù)據(jù)大小三者相關(guān),而與模型的具體結(jié)構(gòu)(層數(shù)/深度/寬度)基本無關(guān)。/
考慮Cost,是因為現(xiàn)在大模型推理成本過高,很多用戶規(guī)模大的應用還不能全面嵌入AI。例如,今天如果開發(fā)一個社交應用,每次跟人聊天統(tǒng)統(tǒng)都要調(diào)用API幫你畫各種東西,最后這個API的成本會讓創(chuàng)業(yè)企業(yè)破產(chǎn)。因此要努力將大模型推理成本降下來。
李開復表示,整個行業(yè)應該用更務實的方法,一方面做一個務實的AGI的信仰者,另一方面要務實地把模型尺寸壓縮下來,把推理成本降低下來,零一萬物在做的是能不能加速比別人的成本更降一步。
“考慮到做一個偉大的大模型公司,不只是底層,同樣重要的還有應用,怎么找到復雜的TC-PMF,怎么把這一批完全不同的人聚在一起協(xié)作,這是我們在硅谷公司一般沒有看到,這是我們獨特的方法,也是中國獨角獸的機會。”李開復強調(diào)。
闡述上述方法論后,李開復還攜一眾團隊大拿,分享了零一萬物的實際操作經(jīng)驗。
零一萬物的4大發(fā)展原則
1、全球布局:模型、產(chǎn)品都面對全球,平行跟跑
一年前開始時,美國全方位領(lǐng)先,我們要謙卑地跟人家學習,人家有好的已經(jīng)被教育的市場里,看在這個市場里怎么達到TC-PMF。
去年9月開始,零一萬物便聚焦生產(chǎn)力、社交賽道于海外應用展開探索,已有 4 款產(chǎn)品陸續(xù)上線。目前零一萬物海外生產(chǎn)力應用總用戶接近千萬,海外產(chǎn)品采用會員訂閱制,營收今年預期過億人民幣。
李開復強調(diào)了成功的經(jīng)驗:“我們平行的在跟跑”。
零一萬物創(chuàng)業(yè)的前三個月招了一批優(yōu)秀的產(chǎn)品負責人,先去最先進的國外市場,用當時最先進的模型GPT-4調(diào)優(yōu)當時所有的PMF,調(diào)到了國外的PMF。與此同時,幾個月間零一萬物國內(nèi)的模型也訓練出來了,在國內(nèi)會把整個應用后端切換到自己的模型上?!霸趪鴥?nèi)能夠幫助我們打造更好的模型和用戶體驗”。
5月初,零一萬物在國內(nèi)推出“萬知”的,這款產(chǎn)品就是在零一萬物團隊在海外已經(jīng)驗證成功達到PMF的產(chǎn)品再推回中國的例子。
現(xiàn)在還在2B方面探索和世界500強達到深度的合作,我們看到美國的一些公司做了行業(yè)的金融大模型,但并不是特別地滿意,我們認為我們可以和世界500強達成獨特的合作,讓它深度合作參與達到雙贏。
2、?;步ǎ?/strong>特別重要,目的是省算力、省成本
“我們今天面臨一個現(xiàn)實,就是美國大廠的GPU數(shù)量,是中國任何公司、尤其是初創(chuàng)公司的十倍以上。在這個前提之下,我們要怎樣才能確保能緊追世界領(lǐng)先的公司,哪怕追上了它現(xiàn)在的產(chǎn)品,它還會有下一個產(chǎn)品的發(fā)布?!?/p>
“既然不能用10萬張GPU來訓練,我們就會尋找別的方式,依然能做出非常好的效果?!?/p>
用有限的資源來打造一個能緊追對手的方法論。在GPU算力稀缺的情況下,只能竭盡全力的提高計算效率。要特別重視 AI Infra。
AI Infra(AI Infrastructure 人工智能基礎架構(gòu)技術(shù)),它涵蓋了人工智能開發(fā)和部署所需的各種底層技術(shù)設施。這些設施包括處理器、操作系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡基礎設施、云計算平臺等,它們共同構(gòu)成了大模型訓練和部署的硬技術(shù)基礎。AI Infra可以被視為連接算力和應用的中間層基礎設施。
零一萬物的模型團隊和Infra架構(gòu)團隊會在一起工作,“這個特別重要”,李開復強調(diào)。這也就是“?;步ā?。
據(jù)介紹,零一萬物的大模型和Infra團隊有1比1規(guī)模。
零一萬物模型訓練負責人黃文灝補充道,算法和Infra要一體優(yōu)化,算法人員會往Infra下面看很多,Infra人員會往算法上看很多,我們最后直接并成一個團隊,這樣我們可以用 One Team 的工作方式來推進。
黃文灝強調(diào),要關(guān)注計算效率,它是算法和Infra做聯(lián)合優(yōu)化的問題,算法人員應該看到很底層的Infra,怎么提高GPU使用率和GPU之間通信的問題,而不是像過去用別人現(xiàn)有的庫調(diào)優(yōu)網(wǎng)絡結(jié)構(gòu),這里面的范式有很大不一樣。零一萬物所有算法人員都可以寫到底層的CUDA算子(注:CUDA是NVIDIA在2006年推出的運算平臺),通信算子,這些都是必備的能力。
李開復曾經(jīng)表示,“做過大模型 Infra 的人比做算法的人才更稀缺”。超強的Infra能力是大模型研發(fā)的核心護城河之一?,F(xiàn)在,李開復稱,重視Infra給零一萬物帶來絕對的大模型訓練成本優(yōu)勢。
3、模應一體:不是只做酷炫的 demo,對用戶有價值,這才是價值
所謂模應一體,即模型和應用一體。
如何做到模應一體?
“零一萬物有比較多的應用在做,包括生產(chǎn)力、社交、娛樂,我們希望所有的應用都基于一個通用的模型。這個預訓練模型作為一個基礎可以服務所有的應用?!秉S文灝介紹。
“我們打破壁壘,算法團隊和應用團隊是一體化。一方面以應用為目標的產(chǎn)品經(jīng)理要不斷去了解基礎,哪些是模型能做的,哪些是模型不能做的,一定要了解產(chǎn)品的邊界在哪里。另一方面技術(shù)人員也要去了解產(chǎn)品的需求到底是什么,找到一個實際的應用和模型能夠快速一體化迭代的方案。”
零一萬物生產(chǎn)力產(chǎn)品負責人曹大鵬介紹,萬知和零一萬物海外的產(chǎn)品,都是在“模應一體”的組織下打造出來。海外產(chǎn)品的ROI(投資回報率)達到1以上。
為什么要“模應一體”,曹大鵬認為,本身模型在不斷提升,模型提升之后,在原來模型基礎上做的應用是不是沒有價值了?這要求產(chǎn)品跟模型要深度預判技術(shù)趨勢,在模型最開始階段或者定義的時候,就把應用思考融入進去。
另外,曹大鵬也分享了零一萬物從0到1打造一個應用產(chǎn)品的關(guān)注點,”我們實踐下來,在0到0.1早期的時候,最核心的產(chǎn)品方法論就是TC-PMF。0到0.1最重要的是怎么讓產(chǎn)品能夠讓用戶使用。0到1我們最關(guān)注產(chǎn)品長期留存,包括能不能產(chǎn)生用戶自傳播的口碑。從1到100的過程需要規(guī)?;鲩L能力,怎么把ROI做到1以上。“
4、AI-First應用:找到”普惠點“,才能爆發(fā)
李開復認為,現(xiàn)在對于所有大模型公司的考驗,在復雜的TC-PMF環(huán)境之下,怎樣同時開發(fā)產(chǎn)品、了解用戶和市場,又考慮到技術(shù)的發(fā)展速度和模型的合理推進,還要考慮推理成本的必然下降……怎么結(jié)合起來在它發(fā)生的那一點,我們可以稱之為“普惠點”,開發(fā)出最好的AI-First應用。
“只有達到普惠,模型成本不會成為做一個海量體量產(chǎn)品的障礙,這樣的popular app才有可能發(fā)生”,曹大鵬進一步舉例道:“抖音真正變成一個Super app是在蘋果手機推出幾年之后,抖音產(chǎn)生Super app的時間點,第一個是4G普及,第二個是安卓千元機的普及,一下子把短視頻的市場擴大100倍?!?/p>
零一萬物一直在努力降低模型使用成本。零一萬物API開放平臺的負責人藍雨川介紹,Yi-Large API現(xiàn)在定價是20元人民幣,對應100萬token數(shù)量。這個數(shù)字大概是GPT-4定價的不到1/3。
李開復稱:“人類的需求是固定的,需要工作、娛樂、溝通、社交、電商、購買,這些需求什么時候才能有AI-Frist應用出來?這個真實帶來的價值就是誰會打造一個AI抖音,AI微信,AI淘寶,我們希望我們有可能作為這樣一個點燃者。如果我們不能做到,希望一個很好的開發(fā)者,能用我們的API做到?!保ü啵?/p>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 一汽大眾宣布高層調(diào)整:潘占福不再擔任黨委書記、總經(jīng)理
- 2024年新能源汽車行業(yè)發(fā)展迅猛,關(guān)鍵技術(shù)加速落地
- 周鴻祎談o3大模型:關(guān)于AGI 的定義,可能得改改了
- 小米汽車與蔚來達成充電補能網(wǎng)絡合作
- 辛巴淚撒直播間自曝患病
- 美團:定制“擦邊騎手服”惡意博流量,將依法追究責任
- 王化辟謠“小米年底大規(guī)模裁員”:造謠者缺乏起碼的常識
- 螞蟻集團進行全面架構(gòu)升級,CTO線大規(guī)模調(diào)整
- 蔚來智能駕駛重大調(diào)整:組織架構(gòu)重組,力推端到端解決方案
- 三星將向國內(nèi)手機廠商提供多樣化高端屏幕,本土廠商競爭加劇
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。