123,123

OpenAI發(fā)布小型模型GPT-4o mini，API價(jià)格再降60%

人閱讀

2024-07-19 09:25:42

來源：TechWeb.com.cn
相關(guān)關(guān)鍵詞

7月19日消息， OpenAI宣布推出GPT-4o mini模型，并稱其為最具成本效益的小型模型。GPT-4o mini 可以替代 GPT-3.5 Turbo，對(duì)標(biāo)的是 Claude 3 Haiku 和 Gemini 1.5 Flash， OpenAI預(yù)計(jì)GPT-4o mini更加經(jīng)濟(jì)實(shí)惠，將能顯著擴(kuò)大使用人工智能構(gòu)建的應(yīng)用范圍。

據(jù)悉，GPT-4o mini在MMLU上的得分為82%，目前在 LMSYS 排行榜的聊天方面分?jǐn)?shù)優(yōu)于 GPT-4。

GPT-4o mini 的商用價(jià)格是每百萬輸入 token 15 美分，每百萬輸出 token 60 美分，比GPT-3.5 Turbo便宜60%以上。

GPT-4o-mini在API（應(yīng)用程序編程接口）中支持文本和視覺，并在未來支持文本、圖像、視頻和音頻輸入和輸出。該模型具有 128K token 的上下文窗口，知識(shí)截至 2023 年 10 月。得益于與 GPT-4o 共享的改進(jìn)版 tokenizer，處理非英語文本能力也更加經(jīng)濟(jì)高效。

具有卓越文本智能和多模態(tài)推理的小型模型

GPT-4o mini在文本智能和多模式推理的學(xué)術(shù)基準(zhǔn)上超越了GPT-3.5 Turbo和其他小型模型，并支持與GPT-4o相同的語言范圍。

GPT-4o mini還展示了函數(shù)調(diào)用的強(qiáng)大性能，這使開發(fā)人員能夠構(gòu)建獲取數(shù)據(jù)或與外部系統(tǒng)進(jìn)行操作的應(yīng)用程序，與GPT-3.5 Turbo相比，它還提高了長上下文性能。

GPT-4o mini已經(jīng)在多個(gè)關(guān)鍵基準(zhǔn)測試中進(jìn)行了評(píng)估：

推理任務(wù)：GPT-4o mini在涉及文本和視覺的推理任務(wù)中優(yōu)于其他小型模型，在文本智能和推理基準(zhǔn)MMLU上的得分為82.0%，而Gemini Flash的得分為77.9%，Claude Haiku的得分為73.8%。

數(shù)學(xué)和編碼能力：GPT-4o mini在數(shù)學(xué)推理和編碼任務(wù)方面表現(xiàn)出色，優(yōu)于市場上其他小型模型。在測量數(shù)學(xué)推理的MGSM上，GPT-4o mini的得分為87.0%，而Gemini Flash的得分為75.5%，Claude Haiku的得分為71.7%。

GPT-4o mini在衡量編碼性能的HumanEval上的得分為87.2%，而Gemini Flash的得分為71.5%，Claude Haiku的得分為75.9%。

多模態(tài)推理：GPT-4o mini在多模態(tài)推理評(píng)估MMMU上也表現(xiàn)出色，得分為59.4%，而Gemini Flash和Claude Haiku的得分分別為56.1%和50.2%。

安全性方面，GPT-4o mini 內(nèi)置了與 GPT-4o 相同的安全緩解措施，OpenAI 根據(jù) Preparedness Framework 和自愿承諾，通過自動(dòng)和人工評(píng)估對(duì)其進(jìn)行了仔細(xì)評(píng)估。70 多名社會(huì)心理學(xué)和錯(cuò)誤信息等領(lǐng)域的外部專家對(duì) GPT-4o 進(jìn)行了測試，以確定潛在風(fēng)險(xiǎn)，這些問題的解決方法會(huì)在即將發(fā)布的 GPT-4o system card 和 Preparedness 記分卡中分享。這些專家評(píng)估得出的見解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

可用性和定價(jià)

GPT-4o-mini現(xiàn)在可以作為文本和視覺模型在 Assistant API、Chat Completions API 和 Batch API 中使用。開發(fā)人員每 100 萬輸入 token 價(jià)格為 15 美分，每 100 萬輸出 token（大約相當(dāng)于一本標(biāo)準(zhǔn)書的 2500 頁）價(jià)格為 60 美分。

OpenAI 計(jì)劃在未來幾天推出GPT-4o mini的微調(diào)版。

從今天開始，在ChatGPT中，F(xiàn)ree、Plus和Team用戶能夠訪問GPT-4o mini，以代替取代 GPT-3.5 Turbo。

企業(yè)用戶將從下周開始獲得訪問權(quán)限。

OpenAI 表示，在過去的幾年里見證了人工智能的顯著進(jìn)步，同時(shí)成本大幅降低。例如，自 2022 年 OpenAI 推出功能較弱的模型 text-davinci-003 ，至如今的 GPT-4o mini ，每個(gè) token 成本已下降了 99%。OpenAI 致力于繼續(xù)降低成本，同時(shí)增強(qiáng)模型功能。人工智能正變得越來越容易獲得、可靠，并嵌入我們的日常數(shù)字體驗(yàn)中。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）