零一萬物新旗艦?zāi)P?Yi-Lightning超越 GPT-4o,李開復(fù)詳解背后原因

10月16日消息,在辟謠“不做大模型預(yù)訓(xùn)練”后,今天零一萬物CEO李開復(fù)正式發(fā)布最新旗艦?zāi)P?Yi-Lightning。

在國際權(quán)威盲測榜單LMSYS 上,Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。

這也意味著零一萬物緊隨 OpenAI、Google 之后,與xAI 打平,進(jìn)擊全球前三大模型企業(yè)。

目前 Yi-Lightning 已上線 Yi 大模型開放平臺(tái)(https://platform.lingyiwanwu.com/),每百萬 token 僅需 0.99 元。

李開復(fù)再次強(qiáng)調(diào):“零一萬物絕不放棄大模型預(yù)訓(xùn)練,而且我們的預(yù)訓(xùn)練做得又快又好?!?/p>

和 Yi-Lightning大模型同時(shí)發(fā)布的,還有零一萬物的To B行業(yè)解決方案——行業(yè)應(yīng)用產(chǎn)品 AI 2.0 數(shù)字人,聚焦零售和電商等場景,將最新版旗艦?zāi)P蛯?shí)踐到行業(yè)解決方案,在彈幕互動(dòng)、商品信息提取、實(shí)時(shí)話術(shù)生成等環(huán)節(jié),AI 2.0 數(shù)字人已接入 Yi-Lightning。

至此,零一萬物大模型在To C和To B端均有推出產(chǎn)品進(jìn)行布局。李開復(fù)對To C和To B的布局的不同側(cè)重也進(jìn)行了深入解讀。

李開復(fù)觀點(diǎn):

1、絕不放棄大模型預(yù)訓(xùn)練,不要認(rèn)為落后美國六個(gè)月是一個(gè)很羞恥的事情

在發(fā)布會(huì)上,李開復(fù)再次提到:“有自媒體聲稱國內(nèi)六家大模型公司里有幾家放棄了大模型預(yù)訓(xùn)練,網(wǎng)上也有很多觀點(diǎn)認(rèn)為,中國預(yù)訓(xùn)練趕不上美國。”

李開復(fù)再次正式辟謠:零一萬物絕不放棄預(yù)訓(xùn)練,而且我們的預(yù)訓(xùn)練做得又快又好。

李開復(fù)稱,在大模型預(yù)訓(xùn)練上,中國是落后美國,有人說落后十年、二十年。今天我們可以用非常精確的數(shù)字來算,因?yàn)镚PT4o是在5月13日做出來的模型,零一萬物在10月16日Yi-Lightning大模型已經(jīng)把它打敗了,所以就是五個(gè)月之后超過五個(gè)月前最強(qiáng)的模型。算中國趕超美國有多遠(yuǎn)的距離,至少零一萬物只差五個(gè)月。

李開復(fù)強(qiáng)調(diào),我們千萬不要認(rèn)為落后美國六個(gè)月是一個(gè)很羞恥的事情,因?yàn)槲液芏嗝绹笥讯颊J(rèn)為中國會(huì)遠(yuǎn)遠(yuǎn)落后,也有美國朋友包括一些中國朋友認(rèn)為,按照這個(gè)打法,人家十萬張GPU,我們要被甩掉三年、五年甚至十年都有可能。現(xiàn)在零一萬物證明了不會(huì)落后這么多,而且這次LMSYS的榜單上也有兩家其他中國公司表現(xiàn)也不錯(cuò),也不是只有我們一家在做。

在李開復(fù)看來,做好預(yù)訓(xùn)練模型是一個(gè)技術(shù)活,需要有懂芯片的人,懂推理的人,懂基礎(chǔ)架構(gòu)的人,懂模型的人,有很好的算法同學(xué),一起做出來。不是每家公司都可以做這件事情,做這件事情的成本也比較高,以后有可能會(huì)越來越少的大模型公司訓(xùn)練做預(yù)訓(xùn)練。

另外,李開復(fù)透露,這次 Yi-Lightning 的預(yù)訓(xùn)練只用了2000張GPU、訓(xùn)練了一個(gè)半月,花了300多萬美金,做出來的預(yù)訓(xùn)練模型能力跟xAI的Grok打平,但是只花了它的1%或2%的成本。

2、不打價(jià)格戰(zhàn)、不做虧本生意,API“白菜價(jià)”也有小利潤

此次,零一萬物最強(qiáng)大模型Yi-Lightning的API定價(jià)為每百萬 token 僅需 0.99 元。

對于這個(gè)價(jià)格,李開復(fù)表示:“我們不會(huì)賠錢賣模型,但也不會(huì)賺很多錢,而是在成本線上加一點(diǎn)點(diǎn)小小的利潤,就得到了今天0.99元/百萬token的價(jià)格。歡迎大家使用,不用擔(dān)心我們被你用垮了。”

同時(shí),李開復(fù)也再次強(qiáng)調(diào):“之前回應(yīng)行業(yè)價(jià)格戰(zhàn)時(shí),我的回答就是零一萬物不參與價(jià)格戰(zhàn)。另外,我當(dāng)時(shí)也提到,不能只看模型價(jià)格,還要看模型性能是否足夠好。”

新旗艦?zāi)P?Yi-Lightning強(qiáng)在哪兒?

繼上半年千億參數(shù)模型 Yi-Large 之后,這次零一萬物發(fā)布的最新旗艦?zāi)P?Yi-Lightning在國際權(quán)威盲測榜單 LMSYS 上超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中國第一。

除了在 LMSYS 這一全球大模型必爭的公開擂臺(tái)上,中國大模型首度實(shí)現(xiàn)“超越 OpenAI GPT-4o ”的最佳成績。

在眾多分榜上,Yi-Lightning 的成績同樣出眾。

在中文分榜上,Yi-Lightning 超越了 xAI 發(fā)布的 Grok-2-08-13、智譜發(fā)布的 GLM-4-Plus 等國內(nèi)外優(yōu)質(zhì)模型,與 o1-mini 等模型并列排名世界第二。

在多輪對話分榜上,Yi-Lightning 則是超越了 Google 所發(fā)布的 Gemini-1.5-Pro 、Anthropic 發(fā)布的 Claude 3.5 Sonnet 等知名旗艦?zāi)P?,排名第三?/p>

數(shù)學(xué)能力,代碼能力方面,Yi-Lightning 同樣處于全球第一梯隊(duì)。在數(shù)學(xué)、代碼分榜上,Yi-Lightning分別取得第三、第四名。

以專業(yè)性與高難度著稱的艱難提問、長提問榜單上,Yi-Lightning 的表現(xiàn)依舊出眾,均取得世界第四的優(yōu)異成績。

LMSYS Chatbot Arena 的用戶體驗(yàn)評估不僅證明了 Yi-Lightning 的出色性能,也更為直觀地驗(yàn)證了大模型解決真實(shí)世界問題的能力。這不僅證明了 Yi-Lightning 優(yōu)異的模型性能,更重要的是,這也意味著 Yi-Lightning 能夠絲滑地由實(shí)驗(yàn)室場景過渡到模擬真實(shí)用戶場景,能夠更快、更高質(zhì)量地實(shí)現(xiàn)模型能力落地。

另外,與 Yi-Large 相比,Yi-Lightning 在模型性能更進(jìn)一步的前提下,推理速度方面有著極大提升。

內(nèi)部評測數(shù)據(jù)顯示,在 8xH100 算力基礎(chǔ)下,以同樣的任務(wù)規(guī)模進(jìn)行測試,Yi-Lightning 的首包時(shí)間(從接收到任務(wù)請求到系統(tǒng)開始輸出響應(yīng)結(jié)果之間的時(shí)間)僅為 Yi-Large 的一半,最高生成速度也提升了近四成。

大模型To B、To C應(yīng)用兩手抓

國內(nèi)大模型賽道狂奔進(jìn)入第二年,商業(yè)化造血能力已經(jīng)成為多方關(guān)注的焦點(diǎn)。

今天,零一萬物也首度公布了全新 To B戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品 AI 2.0 數(shù)字人,聚焦零售和電商等場景,將最新版旗艦?zāi)P蛯?shí)踐到行業(yè)解決方案,在彈幕互動(dòng)、商品信息提取、實(shí)時(shí)話術(shù)生成等環(huán)節(jié),AI 2.0 數(shù)字人已接入 Yi-Lightning。

據(jù)介紹,接入 Yi-Lightning 后,數(shù)字人的實(shí)時(shí)互動(dòng)效果更好,話術(shù)更絲滑,回復(fù)也更準(zhǔn)確;業(yè)務(wù)數(shù)據(jù)方面,在接入 Yi-Lightning 全新加持的數(shù)字人直播后,某酒旅企業(yè)的 GMV 較此前上升 170%。

李開復(fù)表示,一個(gè)大模型公司同時(shí)做To B和To C是很辛苦的,也需要多元化的管理方式,因?yàn)閮蓚€(gè)團(tuán)隊(duì)的基因不一樣,做事的方法和衡量KPI的方法都不太一樣。我自己在這兩個(gè)領(lǐng)域有經(jīng)驗(yàn),也在試著做,但是也絕對不能什么都做。

To B選擇做國內(nèi),李開復(fù)表示,我們找到了一些破局的空間,比如用數(shù)字人來做零售,做餐飲等等,這能做一個(gè)完整的解決方案,另外還有兩三個(gè)領(lǐng)域開始在做,現(xiàn)在還不方便披露。To B工作只能在中國做,因?yàn)橐|達(dá)美國的用戶或國外的用戶不太可能,所以To B的國外就放棄了。在國內(nèi)做To B就做有利潤的解決方案,而不只是賣模型,不只是做項(xiàng)目制,這是零一萬物To B的做法。

To C零一萬物主要布局海外。李開復(fù)認(rèn)為,To C的產(chǎn)品在國內(nèi)走流量有一個(gè)很大的問題,流量的成本越來越高,有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當(dāng)?shù)牧魇?。在這樣一個(gè)挑戰(zhàn)環(huán)境里我們會(huì)非常謹(jǐn)慎,先不推出中國本土新的To C的應(yīng)用,已有的產(chǎn)品還會(huì)繼續(xù)維護(hù),但更多的精力會(huì)在國外的土壤用更低廉的錢買到非常高質(zhì)量的用戶,或者能直接把App賣出去,讓用戶來訂閱收費(fèi),訂閱的習(xí)慣在國外比較良好。國外做To C的產(chǎn)品,目前零一萬物變現(xiàn)能力和消耗用戶增長的成本算賬可以算得過來,以后再關(guān)注國內(nèi)有什么機(jī)會(huì)可以推出To C產(chǎn)品。

李開復(fù)強(qiáng)調(diào),而無論是 ToC 還是 ToB,如何提前預(yù)判 TC-PMF 是繞不開的核心命題。模型性能與推理成本,兩項(xiàng)關(guān)鍵因素直接影響著大模型落地的成敗。作為兼具性能與性價(jià)比的新旗艦?zāi)P?,Yi-Lightning 也將成為零一萬物探索“模應(yīng)一體”的重要基石。零一萬物會(huì)堅(jiān)持“模型+AI Infra+應(yīng)用”三位一體的全棧式布局,積極在 ToB 企業(yè)級解決方案上探索 TC-PMF,以更從容的姿態(tài)迎接即將到來的 AI 普惠時(shí)代。(果青)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-10-16
零一萬物新旗艦?zāi)P?Yi-Lightning超越 GPT-4o,李開復(fù)詳解背后原因
10月16日消息,在辟謠“不做大模型預(yù)訓(xùn)練”后,今天零一萬物CEO李開復(fù)正式發(fā)布最新旗艦?zāi)P?Yi-Lightning。

長按掃碼 閱讀全文