123,123,123

1932年7月，在洛杉磯舉辦的第10屆夏季奧林匹克運(yùn)動(dòng)會(huì)上，一個(gè)只有幾人組成，運(yùn)動(dòng)員僅1人的代表團(tuán)完成了注冊參賽。他們經(jīng)歷了無盡的輾轉(zhuǎn)波折，漫長的海上漂泊，最終來到了奧運(yùn)賽場上，他們來自——中國。

來到賽場，本身就證明了很多，改變了很多。時(shí)至如今，中國的奧運(yùn)之旅已經(jīng)跨過了90年。我問文心一言，中國在奧運(yùn)賽場上取得了哪些成就，它從金牌、獎(jiǎng)牌、成績、覆蓋項(xiàng)目四個(gè)領(lǐng)域進(jìn)行了歸納，并總結(jié)道，“中國代表團(tuán)在夏季奧運(yùn)會(huì)上取得了輝煌的成就，金牌數(shù)量和獎(jiǎng)牌總數(shù)均位居世界前列，同時(shí)在多個(gè)項(xiàng)目中也實(shí)現(xiàn)了歷史性突破”。

3月16日，當(dāng)百度向世界展示文心一言的時(shí)候，我腦海中首先浮出的是這么一句話：中國AI終于來到了奧運(yùn)決賽的賽場上。

我們?yōu)槭裁磿?huì)如此期待文心一言？是對技術(shù)革命的熱忱，對生產(chǎn)力的渴望？這些當(dāng)然都有，但更加急切的是，對中國科技能否真正參與到這輪科技革命的擔(dān)憂和焦慮。

文心一言究竟做到了嗎？

我們第一時(shí)間拿到了文心一言的測試資格，就讓我們從最真實(shí)的產(chǎn)品表現(xiàn)出發(fā)，回溯這條參賽之路。

站在賽場

我相信任何人都不會(huì)認(rèn)為，近期爆火的大語言模型其價(jià)值僅僅在問答，它即將引發(fā)出的廣泛性科技創(chuàng)新是清晰可見的，帶來的價(jià)值遠(yuǎn)遠(yuǎn)超過其基礎(chǔ)。

從2012年深度學(xué)習(xí)技術(shù)成型，到2016年因?yàn)閿?shù)據(jù)集測試效果優(yōu)秀與AlphaGO的良好宣傳效果，第三次AI崛起正式開啟。2018年，預(yù)訓(xùn)練大模型出現(xiàn)，經(jīng)歷了數(shù)年時(shí)間，ChatGPT等應(yīng)用正式通過大語言模型的形式引爆了技術(shù)能量，這可以被看作AI復(fù)興的2.0形態(tài)，是當(dāng)之無愧的時(shí)代焦點(diǎn)。

最重要的是這場比賽才剛剛開始，如果能夠第一時(shí)間參與到全球主流競爭，意味著中國AI可以參與到競爭規(guī)則制定，為上下游發(fā)展獲得先手時(shí)機(jī)，創(chuàng)造出符合中國經(jīng)濟(jì)與社會(huì)需求的戰(zhàn)略周期。

那么，文心一言拿到這張寶貴的“參賽券”了嗎？

3月16日下午，在新聞發(fā)布會(huì)現(xiàn)場百度CEO李彥宏向各界展示了新一代知識增強(qiáng)大語言模型文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個(gè)使用場景中的綜合能力。但大家肯定會(huì)更加好奇，展示效果之外，文心一言的實(shí)測、實(shí)用情況究竟如何？

當(dāng)晚，我們就拿到了文心一言的測試資格，對其進(jìn)行了全方位“拷打”。話不多說，直接上文心一言與ChatGPT的對比，全程無修改無打碼。我們選取了大家最關(guān)心的，也是應(yīng)用度最高的幾方面問題進(jìn)行測試。需要提前說明的是，生成式AI的答案每次都會(huì)不同，因此我們的測試結(jié)果不一定與其他媒體或用戶完全一致。

1.數(shù)理邏輯能力

能夠理解數(shù)理邏輯，回答復(fù)雜問題，一直被視作是ChatGPT的最大特色。那么在這方面文心一言能力是否可觀呢？我們請出了中國人最熟悉的數(shù)理邏輯問題——小學(xué)奧數(shù)，來為大家解答。以一道非常經(jīng)典的行程問題為例，文心一言的答案是這樣的：

可以看到，答題過程雖然簡略，但核心計(jì)算過程是非常清晰的，并且答案準(zhǔn)確無誤，到這里可能效果還沒有拉滿，那我們不妨看看ChatGPT同一個(gè)問題的答案：

嗯，解題過程非常華麗，但最終結(jié)果似乎是欺負(fù)我沒上過小學(xué)。事實(shí)上，直到如今ChatGPT依舊有大量類似問題，可以概括為“一本正經(jīng)地胡說八道”。結(jié)果經(jīng)常出錯(cuò)這件事，對于生成式AI的可信度、可用度其實(shí)是大打折扣的。相比來說，文心一言顯然在邏輯與中文的理解上不落下風(fēng)。

2.中國文化理解

我們知道，對比一家美國公司的AI模型中國文化理解能力，似乎有失偏頗。但對于中國開發(fā)者和用戶來說，AI對中國文化和語言的理解就是核心訴求，這點(diǎn)是毫無疑問的。那么，在這個(gè)領(lǐng)域上文心一言 vs ChatGPT會(huì)有怎樣的表現(xiàn)呢？

先來看一個(gè)關(guān)于唐詩的問題吧。關(guān)于李白和王維的藝術(shù)風(fēng)格，ChatGPT是這樣回答的：

而同樣的問題，文心一言的答案則是這樣的：

雖然ChatGPT的回答也很不錯(cuò)，但顯然對于李白“詩仙”、王維“詩佛”這個(gè)最重要的藝術(shù)內(nèi)核根本沒有涉及。無論是知識科普還是專業(yè)回答，ChatGPT的答案顯然都不能得到高分，而文心一言的回答則更加全面細(xì)致，且總結(jié)歸納能力更強(qiáng)。

我們再來問一個(gè)明清小說的問題，關(guān)于《紅樓夢》的情節(jié)，ChatGPT是這樣答的：

而文心一言的答案，似乎從邏輯調(diào)理上就與ChatGPT完全不同：

這就又不得不吐槽了。ChatGPT回答的不是“主要情節(jié)”，而是“包含哪些內(nèi)容”。相反，文心一言則確實(shí)梳理了主線情節(jié)的條理，并且給出了主線與副線關(guān)系的理解。在此基礎(chǔ)上，對《紅樓夢》的內(nèi)涵做出了具有深度的解析。

對比下來，ChatGPT明顯又犯了答非所問的毛病。但不管怎么說，兩個(gè)AI對于中國文化瑰寶的理解，似乎都值得我們大多數(shù)人羨慕和學(xué)習(xí)。

3.最新信息查詢

對于我們大多數(shù)人而言，都肯定是希望AI問答能夠幫助我們了解世界最近發(fā)生的事情，了解那些最新的消息和動(dòng)態(tài)。但ChatGPT即使在升級GPT-4之后，依舊采用了到2021年為止的數(shù)據(jù)，這也是其廣受詬病的一個(gè)問題。那么，文心一言能不能接入最新、最近的信息呢？

我最近一直沒時(shí)間追番，于是問了問文心一言《名偵探柯南》的最新情節(jié)：

為了確定這就是最新劇情，我又問了這是哪一期：

可如果同一個(gè)問題問ChatGPT，會(huì)得到怎樣的答案呢？

好吧，它委婉的告訴我，想知道就滾去自己看......顯然，獲取最新的知識、新聞、動(dòng)態(tài)，也構(gòu)成了文心一言的獨(dú)特優(yōu)勢。

4.多模態(tài)生成

這一點(diǎn)，目前還是文心一言的專屬能力，ChatGPT并不具備生成圖片的功能?？赡苡腥藭?huì)認(rèn)為以文生圖有專門的模型。但不可否認(rèn)的是，合并到同一個(gè)問題系統(tǒng)中，帶給用戶的便捷性是十分明顯的。既然ChatGPT還沒有類似能力，那我們就讓文心一言生成一張圖片，結(jié)束我們的測試部分：

可以看到，無論對刺客信條還是鋼鐵俠的理解，文心一言都是能夠找到“那個(gè)味”的。

至此，我們可以坦然且真誠地說：文心一言或許并不完美，在很多地方與ChatGPT互有短長。但真的有自己的技術(shù)優(yōu)勢，更加實(shí)用，更加理解中國語言與文化，也更符合中國用戶的需求。

文心一言，真的拿到了大語言模型的決賽資格。

水到渠成的參賽之路

那么我們不禁要問，這背后的原因是什么？為什么又是百度抓住了這個(gè)至關(guān)重要的戰(zhàn)略機(jī)遇？這里面有什么運(yùn)氣或者玄機(jī)嗎？答案或許非常簡單，僅僅有“水到渠成”四個(gè)字。

百度CTO王海峰認(rèn)為：“做文心一言不是頭腦發(fā)熱，是十余年的技術(shù)積累和產(chǎn)業(yè)實(shí)踐的水到渠成，我們在人工智能四層的技術(shù)架構(gòu)上都有很深的積累，尤其是框架層和模型層聯(lián)合優(yōu)化發(fā)揮了非常大的作用?！?/p>

就像芯片是生長在數(shù)學(xué)、光電與制造業(yè)基礎(chǔ)上的。文心一言所代表的大語言模型能力，是生長在AI技術(shù)積累，尤其是大模型與深度學(xué)習(xí)框架之上的。

從2019年開始，百度就發(fā)布了文心大模型ERNIE 1.0。四年時(shí)間，已經(jīng)從最初的自然語言理解大模型，發(fā)展成了跨語言、跨模態(tài)、跨任務(wù)、跨行業(yè)的能力完備的大模型平臺(tái)。在框架方面，百度早在2016年就正式對外開源PaddlePaddle（飛槳），飛槳有效支撐了大模型的靈活開發(fā)、高效訓(xùn)練和推理部署，成為了文心一言誕生的底座。

文心一言另一方面的基礎(chǔ)來自于數(shù)據(jù)和知識，百度在搜索引擎端的龐大數(shù)據(jù)積累、數(shù)據(jù)精細(xì)化處理，以及知識圖譜的搭建，最終成為了文心一言的養(yǎng)料。正所謂你看見的是臺(tái)上一分鐘，看不到的是臺(tái)下十年功，因?yàn)榘俣阮A(yù)判到了全球AI的預(yù)判，每一步都在做正確的事，最終才能實(shí)現(xiàn)又快、又好鍛造出了文心一言。

如果我們把文心一言背后的技術(shù)能力進(jìn)行打開、分解，就可以清晰看到“水到渠成”是如何實(shí)現(xiàn)的。

首先，文心一言就像ChatGPT一樣，吸收了大語言模型業(yè)界公認(rèn)的領(lǐng)先實(shí)現(xiàn)手段。比如有監(jiān)督的模型精調(diào)，確保模型的高魯棒性和吸收數(shù)據(jù)能力；類似人類反饋機(jī)制的的強(qiáng)化學(xué)習(xí)，可以實(shí)現(xiàn)模型基于用戶反饋持續(xù)進(jìn)化，實(shí)現(xiàn)“智能涌動(dòng)”效果；融合不同類型的數(shù)據(jù)、知識，構(gòu)造豐富的提示，生成高質(zhì)量的結(jié)果。

這些能力保證了文心一言能夠區(qū)別于傳統(tǒng)的多輪對話模型，滿足用戶對新型大語言模型的期待，而百度獨(dú)特的技術(shù)才是文心一言煥發(fā)技術(shù)創(chuàng)新力的核心。

這個(gè)領(lǐng)域的技術(shù)，主要包括三個(gè)維度：

首先是知識增強(qiáng)。知識增強(qiáng)是文心系列大模型的核心技術(shù)特征，也自然而然集成到了文心一言當(dāng)中。即通過引入知識圖譜，“知識增強(qiáng)”的方法，將數(shù)據(jù)與知識融合，使得文心大模型相較于其他模型，學(xué)習(xí)效率更高、可解釋性更好。在文心一言能夠?qū)崿F(xiàn)“知識增強(qiáng)”的背后，是百度構(gòu)建了包含5500億事實(shí)的全球最大知識圖譜，從這里我們也可以看到文心一言與文心系列大模型緊密的關(guān)系與一致的技術(shù)序列。百度在大模型領(lǐng)域的積累，最終在文心一言完成了厚積薄發(fā)。

其次是檢索增強(qiáng)。文心一言并入了百度在搜索引擎方面的能力與技術(shù)，百度新一代搜索架構(gòu)已經(jīng)發(fā)展到了基于語義理解和匹配，其中文心大模型分別理解用戶輸入和文檔，形成雙塔模型，然后基于理解進(jìn)行匹配。這讓文心一言可以準(zhǔn)確獲得高時(shí)效性的內(nèi)容，填補(bǔ)了ChatGPT目前為止還無法實(shí)現(xiàn)的空白。同時(shí)，檢索增強(qiáng)也可以優(yōu)化大模型的推理能力，使它的回答更加精確、有效。

此外，文心一言還加入了百度長期積累的對話增強(qiáng)能力。從而使得大模型具有上下文理解、多輪對話等能力，增強(qiáng)對話的連貫性、合理性。

全球領(lǐng)先的技術(shù)范式，需要我們有能力去學(xué)習(xí)和了解；自身儲(chǔ)備的核心技術(shù)能力，則可以在關(guān)鍵時(shí)刻構(gòu)筑差異化。二者結(jié)合，中國AI才有出路。文心一言背后的技術(shù)序列，為中國AI究竟如何發(fā)展點(diǎn)亮了方向。

另一方面，文心一言能夠在如此快速的時(shí)間內(nèi)完成訓(xùn)練、部署，最終為中國AI搶得了先機(jī)，不得不提到背后的開發(fā)基座——飛槳。

在框架層，飛槳是百度自主研發(fā)的中國首個(gè)開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺(tái)，包括核心框架、產(chǎn)業(yè)級模型庫、開發(fā)套件、工具組件，以及學(xué)習(xí)和實(shí)訓(xùn)社區(qū)，能夠標(biāo)準(zhǔn)化、自動(dòng)化地支撐模型生產(chǎn)和應(yīng)用。在飛槳的配合下，文心一言才能夠有效實(shí)現(xiàn)大量最新技術(shù)的融合，同時(shí)在如此短的時(shí)間內(nèi)完成開發(fā)、落地。

從中可以看到，百度已經(jīng)筑造了飛槳+文心，即深度學(xué)習(xí)開發(fā)平臺(tái)+大模型的產(chǎn)業(yè)路徑。二者結(jié)合，企業(yè)和開發(fā)者可以獲得從算力、框架、模型庫，再到大模型調(diào)用、大模型行業(yè)化的所有能力，得到了完善、穩(wěn)固的產(chǎn)業(yè)智能化基座。

文心一言精、快、好落地的今天，就是更多中國大模型脫穎而出的明天。

中國故事，剛剛開始

大語言模型崛起，乃至更宏大的AI復(fù)興與新一輪科技革命，在文心一言的證明下，應(yīng)該可以說上一句：中國故事，才剛剛開始而已。

我們知道大語言模型的應(yīng)用化，可以帶來非常多的產(chǎn)業(yè)發(fā)展可能。其中包括但不限于引領(lǐng)搜索、辦公、客服、內(nèi)容創(chuàng)作等領(lǐng)域的變革；為更多未知應(yīng)用提供底座，甚至形成用戶的超級智能助手。而大模型與行業(yè)的融合，則可能帶來千行百業(yè)的生產(chǎn)力革新。

這些產(chǎn)業(yè)可能性的基礎(chǔ)，必然是中國具備與全球頂尖水平對齊的AI能力，不能留下短板，不能受制于人。

就像AlphaGO的價(jià)值不僅在棋盤上，ChatGPT的價(jià)值不僅在問答中。文心一言的價(jià)值也不僅僅在百度的業(yè)務(wù)范疇內(nèi)，不僅僅是滿足一次“中國能不能做大語言模型”的好奇——它的價(jià)值在更遠(yuǎn)的地方。

向后看，文心一言證明了百度乃至更多中國AI公司的技術(shù)能力。百度是全球?yàn)閿?shù)不多擁有“芯片層、框架層、模型層、應(yīng)用層”全棧AI技術(shù)能力的公司。這些積累究竟能不能打硬仗，能不能實(shí)現(xiàn)與世界一流水平的并排搶跑？這些問題在文心一言這里，也就有了答案。

向前看，中國AI究竟是否能攻堅(jiān)克難，解決關(guān)鍵技術(shù)自主化的時(shí)代難題等未知的問題，需要一些火苗，一些希望。

或許，文心一言剛誕生時(shí)還不完美。這一方面是因?yàn)榧夹g(shù)還需要發(fā)展，模型還需要進(jìn)化；另一方面，是因?yàn)槲覀儗λ兄^高的期待，對中國科技有著過高的期待，極高預(yù)期之下，沒有技術(shù)是完美的。

不妨給文心一言一些耐心，給中國AI一些時(shí)間。難題從來無法馬上被解決，但也只有那些足夠艱難，需要漫長時(shí)間與精力去破解的難題，才有被解決的必要。

好在，中國AI已經(jīng)踏上了奧林匹亞的賽場。參賽，就是無數(shù)可能性的開始，就是話語權(quán)的基座。

會(huì)在某一天，未來的某一天，我們回首看，是八千里路云和月。

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個(gè)人觀點(diǎn)，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

文心一言，站在奧林匹亞

下一篇

文心一言，站在奧林匹亞

下一篇

文心一言，站在奧林匹亞