生成式人工智能:實(shí)現(xiàn)卓越數(shù)據(jù)分析成果的關(guān)鍵
當(dāng)前商業(yè)環(huán)境中的技術(shù)進(jìn)步,吸引著組織尋找利用新技術(shù)的方法。生成式人工智能(GenAI)是一個(gè)廣闊的領(lǐng)域,在過(guò)去幾年中表現(xiàn)出最高的增長(zhǎng)率。
人工智能的生成本質(zhì),正在改變?nèi)藗儗?duì)數(shù)據(jù)分析及其應(yīng)用的看法和觀點(diǎn)。就像給出一組指令一樣簡(jiǎn)單,任何人都可以用文本、圖像、音頻或任何想要的格式來(lái)回應(yīng)。
生成式人工智能技術(shù)
這是人工智能的一個(gè)分支,利用學(xué)習(xí)來(lái)制作創(chuàng)新類型的內(nèi)容,例如圖像、文本、視頻或音樂(lè)。它處理大型數(shù)據(jù)集,并開發(fā)必要的結(jié)構(gòu)和陰影來(lái)模擬原始數(shù)據(jù)。
這些界面的簡(jiǎn)單性主要推動(dòng)了GenAI的大肆宣傳。我們可以用自然語(yǔ)言編寫文本,并在幾秒鐘內(nèi)獲得高質(zhì)量的文本和圖像。它還確定了其在管理原則方面與其他模型截然不同。
生成對(duì)抗網(wǎng)絡(luò)(GAN)
值得注意的是,這項(xiàng)技術(shù)并不是市場(chǎng)上最新的。GenAI最早在60年代用于在聊天機(jī)器人中生成消息。此外,生成式AI在2014年取得了進(jìn)展,并很有可能轉(zhuǎn)變?yōu)楝F(xiàn)今所看到的樣子。GenAI中廣受好評(píng)的方法之一是生成對(duì)抗網(wǎng)絡(luò)(GAN),它是由Ian Goodfellow等人首次提出的。
GAN是一種機(jī)器學(xué)習(xí)算法,它將問(wèn)題構(gòu)建為具有兩個(gè)子模型的監(jiān)督學(xué)習(xí)問(wèn)題。
人工智能模型經(jīng)過(guò)訓(xùn)練可以創(chuàng)建一組屬于特定領(lǐng)域的新數(shù)據(jù)點(diǎn)。相比之下,分類器模型,稱為鑒別器,會(huì)將新數(shù)據(jù)點(diǎn)識(shí)別為真或假。在這種重復(fù)訓(xùn)練中,生成器會(huì)抓住機(jī)會(huì)生成更接近現(xiàn)實(shí)的示例,而鑒別器則會(huì)在確定假樣本和真樣本方面變得更加明智。
變分自動(dòng)編碼器(VAE)
生成建模中的另一種流行方法是,變分自動(dòng)編碼器(VAE)。它由DiederikP.Kingma和MaxWelling于2013年提出,當(dāng)時(shí)作者分別在谷歌和高通工作;VAE與簡(jiǎn)單的自動(dòng)編碼器不同,它使用編碼器-解碼器結(jié)構(gòu)。
編碼器將原始數(shù)據(jù)壓縮成參數(shù)較少的概率分布,解碼器網(wǎng)絡(luò)再將其重構(gòu)回實(shí)際數(shù)據(jù)空間。這種方法也便于構(gòu)建人工人臉或訓(xùn)練人工智能系統(tǒng)的數(shù)據(jù)。
Transformer架構(gòu)(深度學(xué)習(xí))
還有更多的生成式AI模型,包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、擴(kuò)散模型、基礎(chǔ)模型、Transformer模型等。
谷歌研究人員引入了自監(jiān)督的Transformer式學(xué)習(xí),該學(xué)習(xí)也已用于谷歌BERT、OpenAI的ChatGPT和谷歌AlphaFold的LLM開發(fā)。
主要是,在進(jìn)行預(yù)測(cè)或開發(fā)評(píng)估民粹主義的模型時(shí),這破壞了生成式人工智能和數(shù)據(jù)分析。
就像任何其他行業(yè)一樣,生成式人工智能對(duì)數(shù)據(jù)分析行業(yè)產(chǎn)生了重大影響,并帶來(lái)了革命。它在評(píng)估和顯示信息方面至關(guān)重要且用途廣泛。從數(shù)據(jù)清理和處理到可視化,生成式人工智能為有效分析大型復(fù)雜數(shù)據(jù)集提供了新的切入點(diǎn)。
用于數(shù)據(jù)分析的生成式人工智能
生成式人工智能現(xiàn)在已經(jīng)為數(shù)據(jù)分析行業(yè)帶來(lái)了范式轉(zhuǎn)變。在處理和解釋各種數(shù)據(jù)時(shí),它在認(rèn)知和分析系統(tǒng)中發(fā)揮著重要而多樣的作用。數(shù)據(jù)清理、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)解釋和數(shù)據(jù)可視化,是傳統(tǒng)人工智能方法不足的一些領(lǐng)域?,F(xiàn)在,人工智能的產(chǎn)生為從更大、更復(fù)雜的數(shù)據(jù)中獲取洞察力提供了新的可能性。
讓我們來(lái)看看生成式人工智能在數(shù)據(jù)分析領(lǐng)域探索的一些關(guān)鍵角色:
改進(jìn)數(shù)據(jù)預(yù)處理和增強(qiáng)
數(shù)據(jù)挖掘周期包括許多階段,包括數(shù)據(jù)預(yù)處理,以便以可理解和可用的格式獲取數(shù)據(jù)。這個(gè)過(guò)程有幾個(gè)階段,包括數(shù)據(jù)清理、轉(zhuǎn)換、縮減和規(guī)范化,因此很有挑戰(zhàn)性。
生成訓(xùn)練模型的數(shù)據(jù)
對(duì)抗性人工智能可以生成完全虛假的數(shù)據(jù),而生成式人工智能技術(shù)可以生成在大多數(shù)情況下與原始數(shù)據(jù)源相似的虛假數(shù)據(jù)。這應(yīng)該在可用數(shù)據(jù)稀缺或受到隱私協(xié)議限制的情況下使用。
生成的合成數(shù)據(jù)可用作訓(xùn)練和開發(fā)ML模型的來(lái)源,而無(wú)需依賴共享敏感數(shù)據(jù)。這可以保證用戶數(shù)據(jù)的安全,并使大型企業(yè)能夠使用更大的數(shù)據(jù)集進(jìn)行訓(xùn)練,從而獲得更好的模型。
自動(dòng)化分析任務(wù)
商業(yè)智能和數(shù)據(jù)分析中的大多數(shù)活動(dòng)可能需要重復(fù)投入時(shí)間和精力。菜單命令可以自動(dòng)完成這項(xiàng)工作,但編碼需要時(shí)間和精力。使用生成式人工智能可以幫助開發(fā)任意數(shù)量的升級(jí)草案。
增強(qiáng)數(shù)據(jù)可視化
數(shù)據(jù)可視化是數(shù)據(jù)分析的一個(gè)重要方面,因?yàn)樗兄诔尸F(xiàn)數(shù)據(jù)。這種方法有助于吸引利益相關(guān)者,并通過(guò)創(chuàng)建漂亮的圖表、圖形甚至儀表板來(lái)提高做出正確決策的機(jī)會(huì)。
- 萬(wàn)通發(fā)展:終止收購(gòu)索爾思光電60.16%股份
- 聯(lián)特科技預(yù)計(jì)2024年凈利潤(rùn)同比增長(zhǎng)220.96%—334.25%
- 有方科技預(yù)計(jì)2024年凈利潤(rùn)同比增長(zhǎng)365.41%
- 800G和400G高端光模塊銷售大增 中際旭創(chuàng)2024年凈利潤(rùn)增長(zhǎng)111.64%—166.85%
- 亞信安全:預(yù)計(jì)2024年實(shí)現(xiàn)扭虧為盈
- Arm發(fā)布芯粒系統(tǒng)架構(gòu)首個(gè)公開規(guī)范,加速芯片技術(shù)演進(jìn)
- 中國(guó)鐵塔擬新購(gòu)一套應(yīng)急無(wú)人直升機(jī)空中基站
- 427780臺(tái) 中國(guó)鐵塔啟動(dòng)智能維護(hù)攝像機(jī)產(chǎn)品集中招標(biāo)
- 規(guī)模267904臺(tái) 中國(guó)鐵塔啟動(dòng)2025年自研邊緣網(wǎng)關(guān)合作伙伴招標(biāo)
- 國(guó)家數(shù)據(jù)局聲明:未授權(quán)任何“數(shù)據(jù)要素×”相關(guān)有償活動(dòng)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。