7月7日消息,在2023世界人工智能大會(WAIC)啟明創(chuàng)投論壇“生成式AI與大模型:變革與創(chuàng)新”上,啟明創(chuàng)投攜手未盡研究,共同發(fā)布報告《生成式AI》| State of Generative AI 2023。
2022年和2023年,是生成式人工智能技術(shù)取得突破的兩年,過去半年最重要的研究方向,是破解和理解大模型神秘而又令人興奮的智能“涌現(xiàn)”。大模型既需要超越對下一個詞的預(yù)測能力,也需要一個更豐富、更復(fù)雜的“慢思考”深層機(jī)制,來監(jiān)督“快思考”預(yù)測下一個詞的機(jī)制。長期來看,人才對人工智能未來的影響,超過了算力。
基于研究,報告對未來一至三年的大語言模型、多模態(tài)模型和商業(yè)競爭態(tài)勢,做出了十點前瞻:
大語言模型
1. 2024年中國將出現(xiàn)比肩GPT-4的多語言通用大模型;
2. 超長上下文(Long Context)將引領(lǐng)下一次LLM技術(shù)突破;
3. 在出現(xiàn)更有前景的大語言模型之前,為實現(xiàn)垂直領(lǐng)域更好的效果,以下三種方式將共存:
I)在不改變數(shù)據(jù)分布的情況下,利用更多通用數(shù)據(jù)進(jìn)行通用大模型預(yù)訓(xùn)練,不特別引入行業(yè)數(shù)據(jù),
ii)利用行業(yè)專屬數(shù)據(jù)微調(diào)(Fine-Tuning)通用大模型,
iii)利用行業(yè)數(shù)據(jù)占比更高的數(shù)據(jù)集進(jìn)行垂直模型預(yù)訓(xùn)練。
多模態(tài)模型
4. 當(dāng)前CLIP + Diffusion的文生圖模型是過渡態(tài),未來2年內(nèi)將出現(xiàn)一體化的模型結(jié)構(gòu);
5. 下一代Text-to-Image模型將具備更強(qiáng)的可控性,它將結(jié)合底層模型能力和前端控制方式,對模型的設(shè)計將注重與控制方式的結(jié)合;
6. 2025年之前,Video和3D等模態(tài)將迎來里程碑式的模型,大幅提高生成效果;
7. 以PALM-E為代表的具身智能(Embodied AI)展現(xiàn)出在機(jī)器人的感知、理解和決策等方向上的巨大潛力,但當(dāng)前訓(xùn)練和可靠性存在較大挑戰(zhàn);
8. 短期內(nèi)Transformer正成為多個模態(tài)的主流網(wǎng)絡(luò)結(jié)構(gòu),但壓縮整個數(shù)字世界的通用方法尚未出現(xiàn),Transformer并不是人工智能技術(shù)的終點。
商業(yè)機(jī)會
9. 3年內(nèi),顛覆式的AI應(yīng)用的核心驅(qū)動力來自于底層模型的創(chuàng)新,兩者無法解耦,模型的作用將大于產(chǎn)品設(shè)計的作用;
10. 當(dāng)前生成式AI市場處于技術(shù)主導(dǎo)的早期階段,存在千億美元市值的平臺性企業(yè)的機(jī)會。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )