自從2018年谷歌發(fā)布BERT之后
到ChatGPT在火爆全球
大模型的超強(qiáng)能力以及背后的吸金屬性
吸引著無數(shù)廠商對其趨之若鶩
紛紛投入到煉大模型的熱潮中去
這大模型不僅是越來越大
模態(tài)還越“堆”越多
多模態(tài)大模型到底是個(gè)啥?
講到這里,我們先來說說
多模態(tài)大模型中的
這個(gè)“多模態(tài)”到底是個(gè)啥
多模態(tài)的概念源于德國生理學(xué)家
赫爾姆霍茨提出的“感覺道”
加被稱為“感覺通道”
主要探討了人類在感知和認(rèn)知過程中
多種感官的相互作用和協(xié)同工作
如視覺、聽覺、觸覺、味覺和嗅覺等
在人工智能領(lǐng)域
多模態(tài)意味著算法可以處理不止一個(gè)模態(tài)的數(shù)據(jù)
可以在文本、圖像、音頻等
多種類型的數(shù)據(jù)中理解、轉(zhuǎn)譯、生成
有效提高大模型處理多種信息的
準(zhǔn)確性和魯棒性
比如多模態(tài)大模型
理解文字和圖片兩種模態(tài)的數(shù)據(jù)
就能以文生圖,讓畫手直面職業(yè)危機(jī)
理解音頻、視頻、圖片多種形態(tài)的數(shù)據(jù)
在生成工業(yè)質(zhì)檢模型時(shí)
就能實(shí)現(xiàn)視頻分析、圖片分析
甚至音頻分析等多樣化的選擇
自從OpenAI發(fā)布多模態(tài)大模型GPT-4后
全球各大廠商便又開始朝著“好事多?!边M(jìn)發(fā)
這模態(tài)越“堆”越多
前一段時(shí)間還出現(xiàn)了
六模態(tài)大模型和全模態(tài)大模型……
“堆模態(tài)”是喜還是憂?
看著大家爭相發(fā)布多模態(tài)大模型
突然就有一個(gè)問題:
大模型的模態(tài)越多就真的越好嗎?
答案卻是……不一定。
舉個(gè)例子,如果你要建造一棟房子
你會(huì)選擇使用多少種不同的材料呢?
顯然,選擇過多的材料會(huì)導(dǎo)致
建筑成本增加、建設(shè)時(shí)間、精力增加等問題
而多模態(tài)大模型的模態(tài)過多
也會(huì)導(dǎo)致一些問題的出現(xiàn),比如:
1.多模態(tài)不等于湊模態(tài)
如今廠商們都在爭先恐后的發(fā)布
自家的多模態(tài)大模型
其中當(dāng)然有許多精品
但也不乏粗制濫造的水貨
比如在自然語言處理中
增加一個(gè)文字轉(zhuǎn)換語音的功能
就生成自己家練出了多模態(tài)
2.多模態(tài)=高成本
算力資源是各大公司進(jìn)入煉大模型的入場券
數(shù)據(jù)更熟訓(xùn)練大模型的關(guān)鍵
模態(tài)越多大模型
訓(xùn)練所需要的算力就越多
數(shù)據(jù)量也就越豐富
如果公司一味要求模態(tài)的豐富
最終很可能導(dǎo)致大模型模態(tài)多而不精
反而得不償失
3.多模態(tài)不等于好落地
上文也提到了
多模態(tài)大模型在處理復(fù)雜的應(yīng)用場景時(shí)
可能更加有效
然而不同的應(yīng)用場景對模態(tài)的需求是不同的
例如,在自然語言處理領(lǐng)域
對于一些特定任務(wù)
如情感分析或文本分類
使用單一的文本模態(tài)可能已經(jīng)足夠
而不需要額外的圖像或音頻模態(tài)
“貪多嚼不爛”這句俗語
如今也可以用在煉大模型上
廠家們在決定“堆模態(tài)”前
不妨先考慮一下
落地場景、數(shù)據(jù)質(zhì)量、算力資源等綜合因素
適當(dāng)選擇模型結(jié)構(gòu)
切記模型雖好,但不能貪多哦!
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國無人機(jī)禁令升級?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。