傅盛:獵戶星空大模型 在百億參數(shù)榜單完勝

近日,獵戶星空發(fā)布其自主研發(fā)的百億級參數(shù)大模型——Orion-14B。這款集高效能與高性價比于一身的AI模型,在專業(yè)場景的多項關鍵性能指標上可以比肩GPT-4,并可實現(xiàn)千元級消費顯卡運行。

在詳盡的測試評估中,Orion-14B在MMLU、C-Eval、CMMLU、GAOKAO、BBH等多個主流測試集中均榮膺最優(yōu)(SOTA)成績。尤其值得關注的是,在OpenCompass針對中文數(shù)據(jù)集的綜合測評中,該模型在700億參數(shù)以下基座模型中位列榜首,展現(xiàn)了強大的本土化適應能力和全面的語言處理技術。

不僅如此,Orion-14B還展現(xiàn)出卓越的多語言處理實力,在日語和韓語開源模型評測中榮獲全球第一,被贊譽為“出海之光”。在業(yè)界權威的大模型長文本準確度測試“大海撈針”中,Orion-14B更是交出了200K token全綠的成績單,同時支持最高320K token的超長上下文處理,相當于一次性看完小半本《三體》(45萬漢字)這樣的復雜文本內(nèi)容。

獵戶星空強調(diào),Orion-14B的所有成就均基于真實訓練與嚴格測試,堅決杜絕了直接使用基準測試題庫進行針對性訓練的現(xiàn)象。目前,Orion-14B已全面實現(xiàn)開源,用戶可立即在線體驗其卓越性能。

據(jù)了解,能滿足專業(yè)場景及企業(yè)應用需求,主要得益于獵戶星空大模型通過深度微調(diào)策略構建了一套完整的七大應用方向解決方案,包括通用對話、插件優(yōu)化、RAG架構微調(diào)、長Token處理、知識抽取、問答生成以及日韓文定制化服務。此外,為迎合小企業(yè)市場,獵戶星空還推出了近乎無損的INT4量化版本,借助AWQ Q4量化技術,不僅將模型大小壓縮了70%,推理速度更提升高達30%。

這意味著,即便是采用NVIDIA RTX 3060這樣的消費級顯卡,也能實現(xiàn)每秒約50個漢字的高速輸出。而在私有化部署方案上,獵戶星空提供了易于控制服務器與內(nèi)網(wǎng)數(shù)據(jù)的安全方案,同時還開放全套開源免費可商用資源和社區(qū)技術支持。

最后,獵豹移動董事長兼CEO、獵戶星空董事長傅盛對未來趨勢做出大膽預測,至2024年,千億級別大模型的競爭格局將會發(fā)生深刻變化,部分模型可能因應用落地難題而逐漸衰退;相反,像Orion-14B這類具有極高性價比優(yōu)勢的百億大模型,將在百花齊放中綻放異彩。他認為,超越OpenAI等國際巨頭的機會,正掌握在那些專注于大模型應用開發(fā)和商業(yè)化的公司手中,讓我們拭目以待。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )