生成式人工智能:實(shí)現(xiàn)卓越數(shù)據(jù)分析成果的關(guān)鍵

生成式人工智能:實(shí)現(xiàn)卓越數(shù)據(jù)分析成果的關(guān)鍵

當(dāng)前商業(yè)環(huán)境中的技術(shù)進(jìn)步,吸引著組織尋找利用新技術(shù)的方法。生成式人工智能(GenAI)是一個(gè)廣闊的領(lǐng)域,在過(guò)去幾年中表現(xiàn)出最高的增長(zhǎng)率。

人工智能的生成本質(zhì),正在改變?nèi)藗儗?duì)數(shù)據(jù)分析及其應(yīng)用的看法和觀點(diǎn)。就像給出一組指令一樣簡(jiǎn)單,任何人都可以用文本、圖像、音頻或任何想要的格式來(lái)回應(yīng)。

生成式人工智能技術(shù)

這是人工智能的一個(gè)分支,利用學(xué)習(xí)來(lái)制作創(chuàng)新類型的內(nèi)容,例如圖像、文本、視頻或音樂(lè)。它處理大型數(shù)據(jù)集,并開發(fā)必要的結(jié)構(gòu)和陰影來(lái)模擬原始數(shù)據(jù)。

這些界面的簡(jiǎn)單性主要推動(dòng)了GenAI的大肆宣傳。我們可以用自然語(yǔ)言編寫文本,并在幾秒鐘內(nèi)獲得高質(zhì)量的文本和圖像。它還確定了其在管理原則方面與其他模型截然不同。

生成對(duì)抗網(wǎng)絡(luò)(GAN)

值得注意的是,這項(xiàng)技術(shù)并不是市場(chǎng)上最新的。GenAI最早在60年代用于在聊天機(jī)器人中生成消息。此外,生成式AI在2014年取得了進(jìn)展,并很有可能轉(zhuǎn)變?yōu)楝F(xiàn)今所看到的樣子。GenAI中廣受好評(píng)的方法之一是生成對(duì)抗網(wǎng)絡(luò)(GAN),它是由Ian Goodfellow等人首次提出的。

GAN是一種機(jī)器學(xué)習(xí)算法,它將問(wèn)題構(gòu)建為具有兩個(gè)子模型的監(jiān)督學(xué)習(xí)問(wèn)題。

人工智能模型經(jīng)過(guò)訓(xùn)練可以創(chuàng)建一組屬于特定領(lǐng)域的新數(shù)據(jù)點(diǎn)。相比之下,分類器模型,稱為鑒別器,會(huì)將新數(shù)據(jù)點(diǎn)識(shí)別為真或假。在這種重復(fù)訓(xùn)練中,生成器會(huì)抓住機(jī)會(huì)生成更接近現(xiàn)實(shí)的示例,而鑒別器則會(huì)在確定假樣本和真樣本方面變得更加明智。

變分自動(dòng)編碼器(VAE)

生成建模中的另一種流行方法是,變分自動(dòng)編碼器(VAE)。它由DiederikP.Kingma和MaxWelling于2013年提出,當(dāng)時(shí)作者分別在谷歌和高通工作;VAE與簡(jiǎn)單的自動(dòng)編碼器不同,它使用編碼器-解碼器結(jié)構(gòu)。

編碼器將原始數(shù)據(jù)壓縮成參數(shù)較少的概率分布,解碼器網(wǎng)絡(luò)再將其重構(gòu)回實(shí)際數(shù)據(jù)空間。這種方法也便于構(gòu)建人工人臉或訓(xùn)練人工智能系統(tǒng)的數(shù)據(jù)。

Transformer架構(gòu)(深度學(xué)習(xí))

還有更多的生成式AI模型,包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、擴(kuò)散模型、基礎(chǔ)模型、Transformer模型等。

谷歌研究人員引入了自監(jiān)督的Transformer式學(xué)習(xí),該學(xué)習(xí)也已用于谷歌BERT、OpenAI的ChatGPT和谷歌AlphaFold的LLM開發(fā)。

主要是,在進(jìn)行預(yù)測(cè)或開發(fā)評(píng)估民粹主義的模型時(shí),這破壞了生成式人工智能和數(shù)據(jù)分析。

就像任何其他行業(yè)一樣,生成式人工智能對(duì)數(shù)據(jù)分析行業(yè)產(chǎn)生了重大影響,并帶來(lái)了革命。它在評(píng)估和顯示信息方面至關(guān)重要且用途廣泛。從數(shù)據(jù)清理和處理到可視化,生成式人工智能為有效分析大型復(fù)雜數(shù)據(jù)集提供了新的切入點(diǎn)。

用于數(shù)據(jù)分析的生成式人工智能

生成式人工智能現(xiàn)在已經(jīng)為數(shù)據(jù)分析行業(yè)帶來(lái)了范式轉(zhuǎn)變。在處理和解釋各種數(shù)據(jù)時(shí),它在認(rèn)知和分析系統(tǒng)中發(fā)揮著重要而多樣的作用。數(shù)據(jù)清理、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)解釋和數(shù)據(jù)可視化,是傳統(tǒng)人工智能方法不足的一些領(lǐng)域?,F(xiàn)在,人工智能的產(chǎn)生為從更大、更復(fù)雜的數(shù)據(jù)中獲取洞察力提供了新的可能性。

讓我們來(lái)看看生成式人工智能在數(shù)據(jù)分析領(lǐng)域探索的一些關(guān)鍵角色:

改進(jìn)數(shù)據(jù)預(yù)處理和增強(qiáng)

數(shù)據(jù)挖掘周期包括許多階段,包括數(shù)據(jù)預(yù)處理,以便以可理解和可用的格式獲取數(shù)據(jù)。這個(gè)過(guò)程有幾個(gè)階段,包括數(shù)據(jù)清理、轉(zhuǎn)換、縮減和規(guī)范化,因此很有挑戰(zhàn)性。

生成訓(xùn)練模型的數(shù)據(jù)

對(duì)抗性人工智能可以生成完全虛假的數(shù)據(jù),而生成式人工智能技術(shù)可以生成在大多數(shù)情況下與原始數(shù)據(jù)源相似的虛假數(shù)據(jù)。這應(yīng)該在可用數(shù)據(jù)稀缺或受到隱私協(xié)議限制的情況下使用。

生成的合成數(shù)據(jù)可用作訓(xùn)練和開發(fā)ML模型的來(lái)源,而無(wú)需依賴共享敏感數(shù)據(jù)。這可以保證用戶數(shù)據(jù)的安全,并使大型企業(yè)能夠使用更大的數(shù)據(jù)集進(jìn)行訓(xùn)練,從而獲得更好的模型。

自動(dòng)化分析任務(wù)

商業(yè)智能和數(shù)據(jù)分析中的大多數(shù)活動(dòng)可能需要重復(fù)投入時(shí)間和精力。菜單命令可以自動(dòng)完成這項(xiàng)工作,但編碼需要時(shí)間和精力。使用生成式人工智能可以幫助開發(fā)任意數(shù)量的升級(jí)草案。

增強(qiáng)數(shù)據(jù)可視化

數(shù)據(jù)可視化是數(shù)據(jù)分析的一個(gè)重要方面,因?yàn)樗兄诔尸F(xiàn)數(shù)據(jù)。這種方法有助于吸引利益相關(guān)者,并通過(guò)創(chuàng)建漂亮的圖表、圖形甚至儀表板來(lái)提高做出正確決策的機(jī)會(huì)。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-06-12
生成式人工智能:實(shí)現(xiàn)卓越數(shù)據(jù)分析成果的關(guān)鍵
人工智能的生成本質(zhì),正在改變?nèi)藗儗?duì)數(shù)據(jù)分析及其應(yīng)用的看法和觀點(diǎn)。就像給出一組指令一樣簡(jiǎn)單,任何人都可以用文本、圖像、音頻或任何想要的格式來(lái)回應(yīng)。

長(zhǎng)按掃碼 閱讀全文