2023:人工智能之年

毫無疑問,人工智能在2023年掀起了波瀾。下面我們將重點(diǎn)介紹今年最有影響力的一些新聞,它們注定會塑造這個顛覆性行業(yè)的未來:

人工智能的進(jìn)步

在今年的人工智能進(jìn)步景象中,有值得注意的進(jìn)展,已經(jīng)提煉出現(xiàn)有的技術(shù),而不是引入像前一年的ChatGPT或者圖片生成器那樣的突破創(chuàng)新。雖然沒有什么驚艷的效果,真正的通用人工智能(AGI)還很遙遠(yuǎn),但今年標(biāo)志著早期突破與更強(qiáng)大力量到來之間的中間階段。為了展示這種演變,我們制作了一個視覺時間線,突出今年最顯著的人工智能發(fā)展:

圖像生成

Adobe Firefly:Adobe的Firefly和Generative Fill賦能了多樣化的視覺內(nèi)容創(chuàng)造,包括插圖、藝術(shù)概念和照片處理。Adobe Firefly被整合到Photoshop中,使眾多用戶能夠一次性享受到AI的力量。文本效果特性的發(fā)布也算是一大進(jìn)步,它讓用戶可以將樣式或者紋理應(yīng)用到單詞和短語上。
Midjourney:Midjourney的V.5模型在圖像生成中設(shè)置了一個里程碑,展示了提高的效率,連貫性,和更高的分辨率。最新的alpha版本Midjourney V.6帶來了其他的優(yōu)化,比如更精確的提示跟蹤,增加的模型知識,以及少量的文字繪圖能力。
DALL·E 3:基于ChatGPT構(gòu)建的DALL·E 3簡化了圖像生成,消除了復(fù)雜的提示工程的需要。此外,ChatGPT引入了一個能夠幫助用戶根據(jù)反饋優(yōu)化升級圖像的特性。
Shutterstock.AI:這個圖片庫巨頭集成了人工智能功能,讓用戶能將提示變成可授權(quán)的圖象。Shutterstock走在了合理的AI應(yīng)用的最前沿,它辨識并且獎勵了貢獻(xiàn)者。

視頻生成

Stability AI:Stability AI引入了Stable Video Diffusion,這是一種用于生成視頻的突破性模型,并在GitHub上開放了源代碼。借鑒AI圖像生成的趨勢,Stable Video Diffusion模型很可能會在生成大部分AI視頻的過程中發(fā)揮關(guān)鍵作用。
HeyGen:AI初創(chuàng)公司發(fā)布了一個用于視頻中的語音克隆、嘴唇調(diào)整和語言翻譯的工具。
Runway Gen-2:Runway發(fā)布了Gen-2模型,使用戶可以只用文本提示、圖片,或者其它視頻,就能毫不費(fèi)力地生成全新的視頻。下面就是一個例子。
Pika和Pika 1.0:在初始版本發(fā)布之后,Pika獲得了五十萬用戶,每周生成數(shù)百萬視頻。然后升級的AI模型Pika 1.0賦能了用戶以各種風(fēng)格創(chuàng)建和編輯視頻,包括3D動畫、日本動漫、卡通、和電影畫面。
Codec avatars by Meta:Meta的Pixel Codec Avatars (PiCA)模型使我們離視覺感真實(shí)的遠(yuǎn)程存在更近一步。

文本生成

Bard和Gemini:谷歌的"Bard"賦予了聊天機(jī)器人一種像人一樣的情感和情緒。雙子星是在Bard聊天機(jī)器人中引入并且在多模態(tài)數(shù)據(jù)集上進(jìn)行訓(xùn)練的,谷歌稱其為“最有能力的”AI模型,也是OpenAI的ChatGPT的最接近的競爭對手。
Grok:艾隆·馬斯克的創(chuàng)業(yè)公司xAI發(fā)布了“Grok”——一款擁有幽默感、反叛精神和通過X平臺實(shí)時獲取知識的聊天機(jī)器人,以此顯示出其對AI發(fā)展的承諾,可能會與OpenAI競爭。xAI承諾格洛克設(shè)計(jì)用來回答其他AI系統(tǒng)拒絕的挑釁性問題。
OverflowAI:Stack Overflow的OverflowAI增強(qiáng)了知識策展的功能,啟用了AI驅(qū)動的答案搜索,適用于Visual Studio代碼和Slack。
Lama 2:Meta發(fā)布了Lama 2,它的下一代開源的大型語言模型,展示出了增強(qiáng)的效率。Meta優(yōu)化過的LLM也適用于對話用例,而且在大多數(shù)基準(zhǔn)測試中勝出其他開源模型。
GPT-4:OpenAI的GPT-4現(xiàn)在可以處理圖像輸入,生成標(biāo)題,分類,聽取并在對話中進(jìn)行應(yīng)答,支持實(shí)時網(wǎng)頁瀏覽。OpenAI也擴(kuò)展了對插件的支持,從而使得開源競爭者豐富的平臺景觀。GPT-4是OpenAI開發(fā)AGI路程的下一步。
Mistral 7B:今年估值約達(dá)20億美元的Mistral AI發(fā)布了Mistral 7B,這是一款大型語言模型,挑戰(zhàn)GPT-4和Claude 2。為了重申開放科技的路線,Mistral AI提供其模型免費(fèi)下載。
Mixtral 8x7B:Mistral AI也推出了Mixtral 8x7B,這是一款質(zhì)量上乘的稀疏混合專家模型(SMoE),含有公開的權(quán)重,總共有467億個參數(shù),這在增強(qiáng)真實(shí)度和減少偏見的模型中具有開創(chuàng)性。
Yi-34B llm:今年估值達(dá)10億美元的李開復(fù)的創(chuàng)業(yè)公司01.AI發(fā)布了Yi-34B——一款比具有明顯更高參數(shù)計(jì)數(shù)的競爭模型表現(xiàn)更好的開源神經(jīng)網(wǎng)絡(luò),強(qiáng)調(diào)其成本效率。

其它進(jìn)步:

裁剪任何模型(SAM):Meta AI展示了SAM,這是一個"剪切"圖像中物體的裁剪模型,強(qiáng)調(diào)其適應(yīng)性,不需要額外的訓(xùn)練。SAM在大數(shù)據(jù)集上進(jìn)行訓(xùn)練,顯示出在對象分割中的強(qiáng)大表現(xiàn)。
直接偏好優(yōu)化(DPO):DPO成為對大規(guī)模無監(jiān)督語言模型進(jìn)行微調(diào)和教授文本到圖像模型的穩(wěn)定和高效的方法,實(shí)現(xiàn)了精確定制,無需復(fù)雜的人工反饋強(qiáng)化學(xué)習(xí)(RLHF)。
Zephyr直接餾分的LM對齊:由直接餾分偏好優(yōu)化(dDPO)制成的Zephyr-7B成為了帶有70億參數(shù)聊天模型的基準(zhǔn),增強(qiáng)了意圖對齊而無需大量訓(xùn)練。
自主AI代理:自主AI代理作為一個值得注意的趨勢,展示了一個向高級和自主AI系統(tǒng)轉(zhuǎn)變的變革性轉(zhuǎn)變。AI代理被視為AGI的第一眼,因?yàn)樗麄兛梢曰谟脩舻哪繕?biāo)生成自我引導(dǎo)的任務(wù)和指令,并且在達(dá)成目標(biāo)之前自行工作。
EvoDiff:微軟的EvoDiff,這是一個用于快速和節(jié)省成本的蛋白質(zhì)生成的開源AI框架,承諾在治療和工業(yè)應(yīng)用上有所突破。
穩(wěn)定音頻:Stability AI發(fā)布了一個從簡單文本提示生成短小高質(zhì)量音頻剪輯的工具。
GPT商店,版權(quán)保護(hù)盾,ChatGPT機(jī)器人構(gòu)造器:OpenAI推出了GPT商店以出售自定義的GPT機(jī)器人,版權(quán)保護(hù)盾來抵擋與版權(quán)侵權(quán)索賠有關(guān)的法律成本,以及一個用于自定義ChatGPT版本的無代碼平臺。
Stability AI開源其LLM:Stability AI已經(jīng)開源了其模型,StableLM-Alpha和Stable Vicuna,它們因在生成文本和代碼方面的出色表現(xiàn)而聞名。Stable Vicuna是第一個使用人工反饋強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練的開源聊天機(jī)器人。此外,Stability AI還揭示了SDXL Turbo,這是一個實(shí)時的文本到圖像生成模型。

合作

在動態(tài)的2023年,業(yè)界領(lǐng)袖之間有重大合作出現(xiàn),塑造了未來的軌跡。以下是定義了今年AI風(fēng)貌的頂級合并和合作:

Stability AI 和 Init ML

Stability AI進(jìn)行了一項(xiàng)重大動作,收購了熱門編輯應(yīng)用ClipDrop背后的Init ML。目標(biāo)明確:將Stability AI的先進(jìn)技術(shù)融入到ClipDrop的生態(tài)系統(tǒng)中。合作已經(jīng)帶來了SDXL Turbo的開發(fā)。

Runway 和 Getty Images

Runway與Getty Images達(dá)成了策略性合作,推出了新的視頻生成模型RGM(Runway和Getty Images模型)。該模型將Runway的AI能力與Getty Images的授權(quán)創(chuàng)作內(nèi)容庫結(jié)合在一起。合作旨在革新內(nèi)容創(chuàng)建工作流,使公司能夠生成高質(zhì)量,定制的符合品牌身份的視頻。

Snowflake 和 Neeva

數(shù)據(jù)倉庫平臺的巨頭Snowflake收購了Neeva,這是一個以使用生成AI來增強(qiáng)搜索體驗(yàn)而知名的初創(chuàng)公司。Neeva最近關(guān)閉了其訂閱為基礎(chǔ)的、無廣告的搜索引擎。Neeva的創(chuàng)辦者們也承認(rèn),說服用戶嘗試一個新的搜索引擎是一項(xiàng)挑戰(zhàn)。

Shutterstock和OpenAI

Shutterstock和OpenAI承諾進(jìn)行為期六年的長期合作。OpenAI獲取了來自Shutterstock的高質(zhì)量數(shù)據(jù),用各種圖像,視頻和音樂庫豐富其模型訓(xùn)練數(shù)據(jù)集。Shutterstock繼續(xù)利用OpenAI的技術(shù),推出了Shutterstock的AI圖像生成工具。

法律環(huán)境

在不斷發(fā)展的AI的法律領(lǐng)域,2023年頑固于一片充滿不確定性和持續(xù)辯論的環(huán)境。隨著新挑戰(zhàn)的出現(xiàn),有關(guān)版權(quán)、公司政策和更廣闊的監(jiān)管框架的討論繼續(xù),塑造著AI的法律環(huán)境的輪廓。以下是2023年最重要的法律問題:

歐洲AI法案

歐盟推出了世界上第一個全面的AI法案,對AI的使用進(jìn)行規(guī)范。該法案根據(jù)AI系統(tǒng)所帶來的風(fēng)險(xiǎn)進(jìn)行分類,并相應(yīng)地制定規(guī)定。雖然AI法案已經(jīng)得到了暫時的同意,但其實(shí)施面臨延期,執(zhí)行工作將在2025年開始。

美國版權(quán)局對AI生成內(nèi)容的注冊立場

美國版權(quán)局堅(jiān)決拒絕了AI算法Midjourney創(chuàng)作的圖像的版權(quán)注冊申請。該拒絕為未來設(shè)定了一個先例,即僅由AI創(chuàng)作且無人參與的AI藝術(shù)作品不符合版權(quán)保護(hù)的要求。與此同時,美國版權(quán)局就AI輔助作品發(fā)出了指導(dǎo)意見,明確了使用AI工具的人類創(chuàng)作的作品可能符合版權(quán)保護(hù)的要求。該指導(dǎo)意見確認(rèn)了使用AI工具的人類創(chuàng)作的作品應(yīng)根據(jù)人類在這些作品的創(chuàng)作過程中的角色是否具有決定性進(jìn)行評估。

"在當(dāng)前的法律體系下,未準(zhǔn)備好承認(rèn)AI創(chuàng)作的作品的版權(quán),因?yàn)锳I是從屬于其他人的現(xiàn)有數(shù)據(jù)中學(xué)習(xí)的,這挑戰(zhàn)了所有權(quán)的歸屬。解決這個問題的做法預(yù)計(jì)將在明年通過國家進(jìn)行的調(diào)查中得以開展,需要公眾的參與。現(xiàn)在獨(dú)立解決這個問題已經(jīng)很困難,需要有更廣泛的公眾參與?!?/p>

Everypixel公司的企業(yè)律師Daria Kuznetsova說。

麥肯錫還發(fā)布了一個全面的圖表,捕捉到了2023年與AI治理相關(guān)的政策和法規(guī)努力的最重要的方面。視覺呈現(xiàn)突顯了2023年在塑造AI的法律格局方面的重要貢獻(xiàn)。

爭議

2023年充滿了引人入勝的爭議和討論,對AI領(lǐng)域的不確定性和發(fā)展規(guī)則進(jìn)行了深入探討。隨著行業(yè)的發(fā)展,這些爭議變得不可避免,預(yù)示著更多的富有啟發(fā)性的對話和挑戰(zhàn)在地平線上。以下是一些定義了這一年的最值得注意的爭議:

對ChatGPT的公司限制

包括摩根大通、花旗集團(tuán)、美國銀行、德意志銀行、高盛和富國銀行等主要金融機(jī)構(gòu)已經(jīng)限制了ChatGPT的使用,因?yàn)樗麄儗Π踩碗[私問題感到擔(dān)憂。這反映了一個更廣泛的趨勢,即公司正在向員工發(fā)出警告,關(guān)于在企業(yè)環(huán)境中應(yīng)用AI的法律考慮問題。

OpenAI使用低工資工人

《時代》雜志的調(diào)查揭露了OpenAI與Sama的合作,雇用肯尼亞的低工資工人為ChatGPT篩選敏感內(nèi)容。這一發(fā)現(xiàn)引發(fā)了有關(guān)對待工人的方式和內(nèi)容審查對心理健康影響的倫理問題。

OpenAI的領(lǐng)導(dǎo)層更迭

上個月,薩姆·奧爾特曼的離職和快速回歸成為了頭條新聞。OpenAI經(jīng)歷了一次領(lǐng)導(dǎo)層的變更,因?yàn)樗_姆·奧爾特曼在與董事會溝通不一致的情況下辭職。臨時CEO米拉·穆拉蒂以及大部分的員工支持奧爾特曼的回歸。這個前所未有的情況吸引了廣泛的關(guān)注,留下了關(guān)于更迭背后的真正原因和未來影響的問題。

Adobe和Figma

Adobe對Figma的200億美元收購計(jì)劃遇到了監(jiān)管障礙,引發(fā)了歐盟委員會和英國競爭和市場管理局對可能存在的反壟斷問題進(jìn)行的調(diào)查。提議的交易影響也超出了設(shè)計(jì)考慮,因?yàn)锳dobe在客戶數(shù)據(jù)平臺上的主導(dǎo)地位使首席信息官對其在云軟件開支上的潛在影響感到擔(dān)憂。然而,由于在歐洲和英國獲得反壟斷審批的挑戰(zhàn),Adobe放棄了交易,導(dǎo)致了向Figma支付了10億美元的終止費(fèi)。

攝影師黑客攻擊世界攝影大獎

攝影師Boris Eldagsen在索尼世界攝影大獎中提交了AI生成的藝術(shù)作品,引發(fā)了混亂。Eldagsen拒絕接受獎項(xiàng)引發(fā)了對AI生成圖片在傳統(tǒng)攝影比賽中的位置的辯論,挑戰(zhàn)了人們對真實(shí)性和創(chuàng)造性的看法。

本文譯自 everypixel,由 超載雞 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-12-27
2023:人工智能之年
毫無疑問,人工智能在2023年掀起了波瀾。

長按掃碼 閱讀全文