123,123,123

毫無疑問，人工智能在2023年掀起了波瀾。下面我們將重點介紹今年最有影響力的一些新聞，它們注定會塑造這個顛覆性行業(yè)的未來：

人工智能的進(jìn)步

在今年的人工智能進(jìn)步景象中，有值得注意的進(jìn)展，已經(jīng)提煉出現(xiàn)有的技術(shù)，而不是引入像前一年的ChatGPT或者圖片生成器那樣的突破創(chuàng)新。雖然沒有什么驚艷的效果，真正的通用人工智能(AGI)還很遙遠(yuǎn)，但今年標(biāo)志著早期突破與更強大力量到來之間的中間階段。為了展示這種演變，我們制作了一個視覺時間線，突出今年最顯著的人工智能發(fā)展：

圖像生成

Adobe Firefly：Adobe的Firefly和Generative Fill賦能了多樣化的視覺內(nèi)容創(chuàng)造，包括插圖、藝術(shù)概念和照片處理。Adobe Firefly被整合到Photoshop中，使眾多用戶能夠一次性享受到AI的力量。文本效果特性的發(fā)布也算是一大進(jìn)步，它讓用戶可以將樣式或者紋理應(yīng)用到單詞和短語上。
Midjourney：Midjourney的V.5模型在圖像生成中設(shè)置了一個里程碑，展示了提高的效率，連貫性，和更高的分辨率。最新的alpha版本Midjourney V.6帶來了其他的優(yōu)化，比如更精確的提示跟蹤，增加的模型知識，以及少量的文字繪圖能力。
DALL·E 3：基于ChatGPT構(gòu)建的DALL·E 3簡化了圖像生成，消除了復(fù)雜的提示工程的需要。此外，ChatGPT引入了一個能夠幫助用戶根據(jù)反饋優(yōu)化升級圖像的特性。
Shutterstock.AI：這個圖片庫巨頭集成了人工智能功能，讓用戶能將提示變成可授權(quán)的圖象。Shutterstock走在了合理的AI應(yīng)用的最前沿，它辨識并且獎勵了貢獻(xiàn)者。

視頻生成

Stability AI：Stability AI引入了Stable Video Diffusion，這是一種用于生成視頻的突破性模型，并在GitHub上開放了源代碼。借鑒AI圖像生成的趨勢，Stable Video Diffusion模型很可能會在生成大部分AI視頻的過程中發(fā)揮關(guān)鍵作用。
HeyGen：AI初創(chuàng)公司發(fā)布了一個用于視頻中的語音克隆、嘴唇調(diào)整和語言翻譯的工具。
Runway Gen-2：Runway發(fā)布了Gen-2模型，使用戶可以只用文本提示、圖片，或者其它視頻，就能毫不費力地生成全新的視頻。下面就是一個例子。
Pika和Pika 1.0：在初始版本發(fā)布之后，Pika獲得了五十萬用戶，每周生成數(shù)百萬視頻。然后升級的AI模型Pika 1.0賦能了用戶以各種風(fēng)格創(chuàng)建和編輯視頻，包括3D動畫、日本動漫、卡通、和電影畫面。
Codec avatars by Meta：Meta的Pixel Codec Avatars (PiCA)模型使我們離視覺感真實的遠(yuǎn)程存在更近一步。

文本生成

Bard和Gemini：谷歌的"Bard"賦予了聊天機器人一種像人一樣的情感和情緒。雙子星是在Bard聊天機器人中引入并且在多模態(tài)數(shù)據(jù)集上進(jìn)行訓(xùn)練的，谷歌稱其為“最有能力的”AI模型，也是OpenAI的ChatGPT的最接近的競爭對手。
Grok：艾隆·馬斯克的創(chuàng)業(yè)公司xAI發(fā)布了“Grok”——一款擁有幽默感、反叛精神和通過X平臺實時獲取知識的聊天機器人，以此顯示出其對AI發(fā)展的承諾，可能會與OpenAI競爭。xAI承諾格洛克設(shè)計用來回答其他AI系統(tǒng)拒絕的挑釁性問題。
OverflowAI：Stack Overflow的OverflowAI增強了知識策展的功能，啟用了AI驅(qū)動的答案搜索，適用于Visual Studio代碼和Slack。
Lama 2：Meta發(fā)布了Lama 2，它的下一代開源的大型語言模型，展示出了增強的效率。Meta優(yōu)化過的LLM也適用于對話用例，而且在大多數(shù)基準(zhǔn)測試中勝出其他開源模型。
GPT-4：OpenAI的GPT-4現(xiàn)在可以處理圖像輸入，生成標(biāo)題，分類，聽取并在對話中進(jìn)行應(yīng)答，支持實時網(wǎng)頁瀏覽。OpenAI也擴展了對插件的支持，從而使得開源競爭者豐富的平臺景觀。GPT-4是OpenAI開發(fā)AGI路程的下一步。
Mistral 7B：今年估值約達(dá)20億美元的Mistral AI發(fā)布了Mistral 7B，這是一款大型語言模型，挑戰(zhàn)GPT-4和Claude 2。為了重申開放科技的路線，Mistral AI提供其模型免費下載。
Mixtral 8x7B：Mistral AI也推出了Mixtral 8x7B，這是一款質(zhì)量上乘的稀疏混合專家模型(SMoE)，含有公開的權(quán)重，總共有467億個參數(shù)，這在增強真實度和減少偏見的模型中具有開創(chuàng)性。
Yi-34B llm：今年估值達(dá)10億美元的李開復(fù)的創(chuàng)業(yè)公司01.AI發(fā)布了Yi-34B——一款比具有明顯更高參數(shù)計數(shù)的競爭模型表現(xiàn)更好的開源神經(jīng)網(wǎng)絡(luò)，強調(diào)其成本效率。

其它進(jìn)步:

裁剪任何模型(SAM)：Meta AI展示了SAM，這是一個"剪切"圖像中物體的裁剪模型，強調(diào)其適應(yīng)性，不需要額外的訓(xùn)練。SAM在大數(shù)據(jù)集上進(jìn)行訓(xùn)練，顯示出在對象分割中的強大表現(xiàn)。
直接偏好優(yōu)化(DPO)：DPO成為對大規(guī)模無監(jiān)督語言模型進(jìn)行微調(diào)和教授文本到圖像模型的穩(wěn)定和高效的方法，實現(xiàn)了精確定制，無需復(fù)雜的人工反饋強化學(xué)習(xí)(RLHF)。
Zephyr直接餾分的LM對齊：由直接餾分偏好優(yōu)化(dDPO)制成的Zephyr-7B成為了帶有70億參數(shù)聊天模型的基準(zhǔn)，增強了意圖對齊而無需大量訓(xùn)練。
自主AI代理：自主AI代理作為一個值得注意的趨勢，展示了一個向高級和自主AI系統(tǒng)轉(zhuǎn)變的變革性轉(zhuǎn)變。AI代理被視為AGI的第一眼，因為他們可以基于用戶的目標(biāo)生成自我引導(dǎo)的任務(wù)和指令，并且在達(dá)成目標(biāo)之前自行工作。
EvoDiff：微軟的EvoDiff，這是一個用于快速和節(jié)省成本的蛋白質(zhì)生成的開源AI框架，承諾在治療和工業(yè)應(yīng)用上有所突破。
穩(wěn)定音頻：Stability AI發(fā)布了一個從簡單文本提示生成短小高質(zhì)量音頻剪輯的工具。
GPT商店，版權(quán)保護盾，ChatGPT機器人構(gòu)造器：OpenAI推出了GPT商店以出售自定義的GPT機器人，版權(quán)保護盾來抵擋與版權(quán)侵權(quán)索賠有關(guān)的法律成本，以及一個用于自定義ChatGPT版本的無代碼平臺。
Stability AI開源其LLM：Stability AI已經(jīng)開源了其模型，StableLM-Alpha和Stable Vicuna，它們因在生成文本和代碼方面的出色表現(xiàn)而聞名。Stable Vicuna是第一個使用人工反饋強化學(xué)習(xí)(RLHF)訓(xùn)練的開源聊天機器人。此外，Stability AI還揭示了SDXL Turbo，這是一個實時的文本到圖像生成模型。

合作

在動態(tài)的2023年，業(yè)界領(lǐng)袖之間有重大合作出現(xiàn)，塑造了未來的軌跡。以下是定義了今年AI風(fēng)貌的頂級合并和合作：

Stability AI 和 Init ML
Stability AI進(jìn)行了一項重大動作，收購了熱門編輯應(yīng)用ClipDrop背后的Init ML。目標(biāo)明確：將Stability AI的先進(jìn)技術(shù)融入到ClipDrop的生態(tài)系統(tǒng)中。合作已經(jīng)帶來了SDXL Turbo的開發(fā)。
Runway 和 Getty Images
Runway與Getty Images達(dá)成了策略性合作，推出了新的視頻生成模型RGM(Runway和Getty Images模型)。該模型將Runway的AI能力與Getty Images的授權(quán)創(chuàng)作內(nèi)容庫結(jié)合在一起。合作旨在革新內(nèi)容創(chuàng)建工作流，使公司能夠生成高質(zhì)量，定制的符合品牌身份的視頻。
Snowflake 和 Neeva
數(shù)據(jù)倉庫平臺的巨頭Snowflake收購了Neeva，這是一個以使用生成AI來增強搜索體驗而知名的初創(chuàng)公司。Neeva最近關(guān)閉了其訂閱為基礎(chǔ)的、無廣告的搜索引擎。Neeva的創(chuàng)辦者們也承認(rèn)，說服用戶嘗試一個新的搜索引擎是一項挑戰(zhàn)。
Shutterstock和OpenAI
Shutterstock和OpenAI承諾進(jìn)行為期六年的長期合作。OpenAI獲取了來自Shutterstock的高質(zhì)量數(shù)據(jù)，用各種圖像,視頻和音樂庫豐富其模型訓(xùn)練數(shù)據(jù)集。Shutterstock繼續(xù)利用OpenAI的技術(shù)，推出了Shutterstock的AI圖像生成工具。

法律環(huán)境

在不斷發(fā)展的AI的法律領(lǐng)域，2023年頑固于一片充滿不確定性和持續(xù)辯論的環(huán)境。隨著新挑戰(zhàn)的出現(xiàn)，有關(guān)版權(quán)、公司政策和更廣闊的監(jiān)管框架的討論繼續(xù)，塑造著AI的法律環(huán)境的輪廓。以下是2023年最重要的法律問題：

歐洲AI法案
歐盟推出了世界上第一個全面的AI法案，對AI的使用進(jìn)行規(guī)范。該法案根據(jù)AI系統(tǒng)所帶來的風(fēng)險進(jìn)行分類，并相應(yīng)地制定規(guī)定。雖然AI法案已經(jīng)得到了暫時的同意，但其實施面臨延期，執(zhí)行工作將在2025年開始。
美國版權(quán)局對AI生成內(nèi)容的注冊立場
美國版權(quán)局堅決拒絕了AI算法Midjourney創(chuàng)作的圖像的版權(quán)注冊申請。該拒絕為未來設(shè)定了一個先例，即僅由AI創(chuàng)作且無人參與的AI藝術(shù)作品不符合版權(quán)保護的要求。與此同時，美國版權(quán)局就AI輔助作品發(fā)出了指導(dǎo)意見，明確了使用AI工具的人類創(chuàng)作的作品可能符合版權(quán)保護的要求。該指導(dǎo)意見確認(rèn)了使用AI工具的人類創(chuàng)作的作品應(yīng)根據(jù)人類在這些作品的創(chuàng)作過程中的角色是否具有決定性進(jìn)行評估。

"在當(dāng)前的法律體系下，未準(zhǔn)備好承認(rèn)AI創(chuàng)作的作品的版權(quán)，因為AI是從屬于其他人的現(xiàn)有數(shù)據(jù)中學(xué)習(xí)的，這挑戰(zhàn)了所有權(quán)的歸屬。解決這個問題的做法預(yù)計將在明年通過國家進(jìn)行的調(diào)查中得以開展，需要公眾的參與。現(xiàn)在獨立解決這個問題已經(jīng)很困難，需要有更廣泛的公眾參與?！?/p>
Everypixel公司的企業(yè)律師Daria Kuznetsova說。

麥肯錫還發(fā)布了一個全面的圖表，捕捉到了2023年與AI治理相關(guān)的政策和法規(guī)努力的最重要的方面。視覺呈現(xiàn)突顯了2023年在塑造AI的法律格局方面的重要貢獻(xiàn)。

爭議

2023年充滿了引人入勝的爭議和討論，對AI領(lǐng)域的不確定性和發(fā)展規(guī)則進(jìn)行了深入探討。隨著行業(yè)的發(fā)展，這些爭議變得不可避免，預(yù)示著更多的富有啟發(fā)性的對話和挑戰(zhàn)在地平線上。以下是一些定義了這一年的最值得注意的爭議：

對ChatGPT的公司限制
包括摩根大通、花旗集團、美國銀行、德意志銀行、高盛和富國銀行等主要金融機構(gòu)已經(jīng)限制了ChatGPT的使用，因為他們對安全和隱私問題感到擔(dān)憂。這反映了一個更廣泛的趨勢，即公司正在向員工發(fā)出警告，關(guān)于在企業(yè)環(huán)境中應(yīng)用AI的法律考慮問題。
OpenAI使用低工資工人
《時代》雜志的調(diào)查揭露了OpenAI與Sama的合作，雇用肯尼亞的低工資工人為ChatGPT篩選敏感內(nèi)容。這一發(fā)現(xiàn)引發(fā)了有關(guān)對待工人的方式和內(nèi)容審查對心理健康影響的倫理問題。
OpenAI的領(lǐng)導(dǎo)層更迭
上個月，薩姆·奧爾特曼的離職和快速回歸成為了頭條新聞。OpenAI經(jīng)歷了一次領(lǐng)導(dǎo)層的變更，因為薩姆·奧爾特曼在與董事會溝通不一致的情況下辭職。臨時CEO米拉·穆拉蒂以及大部分的員工支持奧爾特曼的回歸。這個前所未有的情況吸引了廣泛的關(guān)注，留下了關(guān)于更迭背后的真正原因和未來影響的問題。
Adobe和Figma
Adobe對Figma的200億美元收購計劃遇到了監(jiān)管障礙，引發(fā)了歐盟委員會和英國競爭和市場管理局對可能存在的反壟斷問題進(jìn)行的調(diào)查。提議的交易影響也超出了設(shè)計考慮，因為Adobe在客戶數(shù)據(jù)平臺上的主導(dǎo)地位使首席信息官對其在云軟件開支上的潛在影響感到擔(dān)憂。然而，由于在歐洲和英國獲得反壟斷審批的挑戰(zhàn)，Adobe放棄了交易，導(dǎo)致了向Figma支付了10億美元的終止費。
攝影師黑客攻擊世界攝影大獎
攝影師Boris Eldagsen在索尼世界攝影大獎中提交了AI生成的藝術(shù)作品，引發(fā)了混亂。Eldagsen拒絕接受獎項引發(fā)了對AI生成圖片在傳統(tǒng)攝影比賽中的位置的辯論，挑戰(zhàn)了人們對真實性和創(chuàng)造性的看法。

本文譯自 everypixel，由超載雞編輯發(fā)布。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）