3月18日消息,在瀾舟科技大模型技術(shù)和產(chǎn)品發(fā)布會(huì)上,瀾舟科技創(chuàng)始人&CEO周明博士發(fā)表了《大模型技術(shù)和應(yīng)用雙輪驅(qū)動(dòng)加速創(chuàng)新》主題演講。他回顧了瀾舟科技的發(fā)展歷程,總結(jié)出大模型創(chuàng)業(yè)在企業(yè)級(jí)客戶中落地的“九字訣”,并展望了瀾舟科技未來(lái)的發(fā)展方向。
瀾舟科技創(chuàng)始人&CEO周明博士
瀾舟科技于2021年6月正式成立, 致力于自主研發(fā)大模型技術(shù)和行業(yè)應(yīng)用,在去年3月發(fā)布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2(含孟子大模型-標(biāo)準(zhǔn)、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對(duì)公眾開(kāi)放。
公開(kāi)資料顯示,瀾舟科技創(chuàng)始人&CEO周明是世界頂級(jí)的AI科學(xué)家,自然語(yǔ)言處理領(lǐng)域的代表性人物。曾任微軟亞洲研究院副院長(zhǎng)、國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)主席?,F(xiàn)任中國(guó)計(jì)算機(jī)學(xué)會(huì)副理事長(zhǎng)、中國(guó)中文信息學(xué)會(huì)常務(wù)理事。
2024年是大模型落地元年
周明回顧了過(guò)去一年來(lái)大模型在六個(gè)領(lǐng)域的迅速發(fā)展:
? 大模型的能力得到快速提升:在更長(zhǎng)的上下文處理能力、數(shù)學(xué)能力和推理能力、安全對(duì)齊等方面得到大幅度增強(qiáng)。
? RAG(檢索增強(qiáng)生成):通過(guò)結(jié)合搜索相關(guān)數(shù)據(jù)庫(kù)的結(jié)果與用戶指令進(jìn)行生成,可有效改善模型幻象、實(shí)時(shí)性、數(shù)據(jù)安全等問(wèn)題。
? GPTs:用戶基于大模型的超強(qiáng)能力方便地搭建自定義的GPT。
? 多模態(tài)大模型:SORA突破了4秒鐘限制,可以生成60秒的視頻,而且生成的視頻質(zhì)量大幅度提升。
? 大模型原生應(yīng)用方面略現(xiàn)端倪:譬如,利用大模型構(gòu)建AI搜索、角色扮演聊天、數(shù)字人等。
? 大模型開(kāi)源:LLaMA等開(kāi)源模型有力地推動(dòng)大模型的普及和發(fā)展,也顯著地改變了大模型的競(jìng)爭(zhēng)格局。
周明強(qiáng)調(diào)2024年將是大模型落地元年,如何利用大模型技術(shù)助力企業(yè)成長(zhǎng)已成為業(yè)界關(guān)注的焦點(diǎn)。政府工作報(bào)告新鮮出爐,特別強(qiáng)調(diào)以人工智能+,驅(qū)動(dòng)各行各業(yè)的轉(zhuǎn)型升級(jí)。周明認(rèn)為要把握好這個(gè)歷史契機(jī),通過(guò)落地,創(chuàng)造價(jià)值,拉動(dòng)創(chuàng)新。
周明強(qiáng)調(diào),瀾舟科技注重“技術(shù)創(chuàng)新和落地應(yīng)用”雙輪驅(qū)動(dòng)。在積極研究和掌握前沿技術(shù)的同時(shí),公司也致力于確保這些技術(shù)的有效應(yīng)用。
大模型落地九字法則
而談及如何做好大模型落地應(yīng)用,周明表示,雷軍所說(shuō)的互聯(lián)網(wǎng)的七字法則“專注、極致、口碑和快”仍然適用,還要再加上“成本”,大模型創(chuàng)業(yè)不能不在意成本,一定要有造血的能力,形成大模型落地九字法則:“專注、極致、口碑、快、成本”。
周明稱,這“九字訣”融會(huì)貫通在瀾舟的一切行動(dòng)之中:
首先,瀾舟科技定位非常清楚,就是做大模型技術(shù)+企業(yè)場(chǎng)景應(yīng)用的一個(gè)綜合公司。
企業(yè)定位做2B、做技術(shù)和服務(wù),需要明白克服什么挑戰(zhàn),不能盲目地天天練大模型,發(fā)布了、開(kāi)源了就可以了,不是這樣的。
通過(guò)過(guò)去兩年多的積攢調(diào)研客戶,瀾舟科技發(fā)現(xiàn)了四大問(wèn)題,如果解決不好,大模型基本上就是泡影。
這四大問(wèn)題:一是訓(xùn)練和部署的成本問(wèn)題。動(dòng)輒上千萬(wàn)的模型銷售,用戶是不能接受的;二是行業(yè)的適配,很多人說(shuō)大模型做出來(lái)之后千行百業(yè)隨便用,肯定好使,沒(méi)有這種好事;三是幻象問(wèn)題,很多大模型生成的解決內(nèi)行人看起來(lái)像外行,外行的人看起來(lái)像內(nèi)行,這樣似是而非的東西企業(yè)不敢用;四是數(shù)據(jù)安全的問(wèn)題,企業(yè)的數(shù)據(jù)不愿意拿出來(lái),怎么樣解決企業(yè)的擔(dān)心。
針對(duì)大模型訓(xùn)練和部署的成本高的問(wèn)題,瀾舟科技專注把ToB場(chǎng)景使用最多的LLM模型(參數(shù)量7B、13B、40B最高到100B)做到最佳并大幅度提升大模型的推理效率。
針對(duì)大模型的行業(yè)落地適配問(wèn)題,瀾舟科技提出了L1-L2-L3-L4的層次化分級(jí)服務(wù)體系, 基于L1-通用大模型,在此基礎(chǔ)上加入行業(yè)數(shù)據(jù)訓(xùn)練出L2-行業(yè)/垂直大模型,如金融、編程大模型。
針對(duì)大模型的幻象問(wèn)題和用戶數(shù)據(jù)安全問(wèn)題,孟子大模型提出了改進(jìn)的RAG能力。通過(guò)孟子大模型理解用戶意圖,可分別經(jīng)過(guò)大模型自身,或者通過(guò)RAG查找用戶知識(shí)庫(kù),甚至通過(guò)Web搜索,最后多路召回搜索結(jié)果,經(jīng)過(guò)排序輸出最可信結(jié)果。
目前,瀾舟科技已經(jīng)形成了從預(yù)訓(xùn)練,到SFT,到強(qiáng)化學(xué)習(xí),安全,降低幻覺(jué)的完備的孟子大模型訓(xùn)練體系,并提出了“一橫N縱”的發(fā)展體系。
其中“一橫”即為孟子大模型技術(shù),而“N縱”是基于孟子大模型的面向ToB應(yīng)用最重要的技術(shù)和產(chǎn)品?!癗縱”的應(yīng)用能力型產(chǎn)品,包括AI文檔理解、文檔問(wèn)答、文檔輔助寫(xiě)作、機(jī)器翻譯、瀾舟智會(huì)、AI搜索等。
希望通過(guò)“一橫N縱”,徹底貫徹大模型落地九字法則:專注、極致、口碑、快、成本。
周明強(qiáng)調(diào),瀾舟一方面聚焦自己擅長(zhǎng)的能力和場(chǎng)景,另外一方面會(huì)注重與開(kāi)源社區(qū)、與客戶和合作伙伴攜手共進(jìn),共同拓展更廣闊的市場(chǎng)空間,實(shí)現(xiàn)互惠共贏的局面。
據(jù)悉,瀾舟科技已經(jīng)攜手客戶及合作伙伴,如傳神、數(shù)說(shuō)故事、華為云、華夏基金、同花順、中金公司等,共同開(kāi)展深入合作。(宜月)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )