OpenAI推出了o3-mini,旨在為技術領域提供更高效且價格合理的AI推理模型。它在多個測試中表現(xiàn)出色,特別適合編程、數(shù)學和科學問題。
OpenAI于周五發(fā)布了其最新的“推理”模型——o3-mini,成為公司o系列推理模型的最新成員。此舉發(fā)布之際正值OpenAI面臨巨大挑戰(zhàn)和機遇的關鍵時刻,尤其是在與中國公司DeepSeek競爭中,OpenAI正努力維系與華盛頓的關系,并為全球最大的一輪融資做準備。
o3-mini定位為一款“強大”且“實惠”的推理模型,它不同于大多數(shù)大型語言模型,能夠在提供答案之前進行詳細的事實核查,從而避免一些常見的錯誤。雖然推理過程稍顯緩慢,但它提供的答案通常更為可靠,尤其在物理等領域,盡管并不完美。
o3-mini主要針對STEM(科學、技術、工程和數(shù)學)領域,特別是編程、數(shù)學和科學問題。OpenAI表示,o3-mini的能力與o1系列(如o1和o1-mini)相當,但運行速度更快且成本更低。外部測試人員反饋稱,o3-mini在超過一半的時間里提供的答案比o1-mini更具優(yōu)勢,并且在面對“復雜實際問題”時,出錯率比o1-mini少了39%。此外,o3-mini給出的答案更清晰,速度也快了約24%。
從今天開始,o3-mini將通過ChatGPT向所有用戶開放,付費用戶可以享受每天150次查詢的更高配額。ChatGPT Pro用戶則可以享受無限制使用,而ChatGPT Enterprise和Edu用戶將在一周內(nèi)獲得該功能(ChatGPT Gov尚無消息)。免費用戶也可以通過點擊聊天欄中的“推理”按鈕使用o3-mini。
對于開發(fā)者,o3-mini也將在API中提供,但目前不支持圖像分析。開發(fā)者可以根據(jù)自己的需求選擇推理力度(低、中或高),以優(yōu)化響應速度。
在定價方面,o3-mini每百萬個輸入token收費0.55美元,每百萬個輸出token收費4.40美元,遠低于o1-mini的定價,且與DeepSeek的R1推理模型定價競爭。值得注意的是,o3-mini在“中等推理力度”下,提供了“速度和準確性之間的平衡”。付費用戶還可以選擇“o3-mini-high”來獲得更高的智能,但響應速度較慢。
盡管o3-mini并非OpenAI最強大的模型,也未在所有基準測試中超過DeepSeek的R1,但它在許多查詢中提供了更具競爭力的低成本和低延遲答案。OpenAI強調(diào),o3-mini在“安全性”方面與o1系列持平,甚至在一些挑戰(zhàn)性安全和破解測試中超越了GPT-4。
總的來說,o3-mini的發(fā)布標志著OpenAI在推動成本效益智能領域的又一重要進步,尤其是在為技術領域提供高效、實用的推理解決方案方面。
本文譯自 TechCrunch,由 BALI 編輯發(fā)布。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )