日前,我們從華為云官方了解到,華為推出了一款基于華為云AI技術(shù)的全新產(chǎn)品,來自華為諾亞方舟實(shí)驗(yàn)室新推出的寫詩AI“樂府”,其不僅能寫詩、作詞,而且還能寫藏頭詩。自產(chǎn)品問世以來,就引發(fā)了不少網(wǎng)友的關(guān)注,不少網(wǎng)友更是為強(qiáng)大的華為云AI技術(shù)點(diǎn)贊。
針對(duì)這款基于華為云AI技術(shù)打造的產(chǎn)品,華為諾亞方舟實(shí)驗(yàn)室語音語義首席科學(xué)家劉群也講述了華為云AI背后的故事,其表示,我們不懂詩,且在這個(gè)系統(tǒng)中,并沒有用詩的規(guī)矩去訓(xùn)練,這一切都是系統(tǒng)自己學(xué)到的。
那么,華為云AI技術(shù)是如何實(shí)現(xiàn)寫詩的呢?對(duì)此,一位負(fù)責(zé)華為云AI研發(fā)的負(fù)責(zé)人給出了答案。據(jù)其介紹,生成中國的古詩詞與自由生成文本不同,通常需要滿足內(nèi)容和形式兩個(gè)方面的要求。中國的古詩詞有各種各樣的形式,比如五律、七律、五絕、七絕、滿江紅、西江月、水調(diào)歌頭等各種詞牌以及對(duì)聯(lián),每一種都有相應(yīng)的押韻、平仄、字?jǐn)?shù)、對(duì)仗等規(guī)定;內(nèi)容方面,一首詩要圍繞著一個(gè)主題展開,同時(shí)還要保證內(nèi)容的連貫性,它的要求相對(duì)而言是比較復(fù)雜的。
華為提出的“樂府”系統(tǒng),與當(dāng)前大多數(shù)解決方案不同,它是基于華為云AI打造的,不需要任何特性或者人工設(shè)定規(guī)則,也沒有設(shè)計(jì)任何額外的神經(jīng)元組件。在研究的過程中,華為云AI技術(shù)需要做的是把訓(xùn)練用的詩詞序列化為格式化的文本序列,作為訓(xùn)練數(shù)據(jù)。并通過對(duì)語言模型token的抽樣,生成滿足內(nèi)容和形式要求的詩詞,比如律詩、絕句、對(duì)聯(lián)以及詞等等。
值得注意的是,樂府AI是首個(gè)基于GPT打造的作詩系統(tǒng),而且與谷歌提出的BERT息息相關(guān)。整體的GPT模型是在BERT的源代碼基礎(chǔ)上實(shí)現(xiàn)的,Transformer大小的配置也采用了BERT中發(fā)布的中文 vocab和tokenization 腳本,與BERT-Base相同。
整個(gè)模型訓(xùn)練過程一共有兩個(gè)階段: 微調(diào)和預(yù)訓(xùn)練。其中,預(yù)訓(xùn)練是在華為云AI上完成的,一共耗費(fèi)了90個(gè)小時(shí),期間共訓(xùn)練了4個(gè)echo,使用8塊英偉達(dá)V100(16G) GPU。微調(diào)的過程是將所有詩歌序列輸入Transformer,并訓(xùn)練一個(gè)自回歸語言模型。而當(dāng)整個(gè)訓(xùn)練完成之后,需要將通過華為云AI技術(shù)生成的詩歌格式和主題轉(zhuǎn)化為一個(gè)初始序列,并將其輸入到模型中,最后再進(jìn)行解碼即可。
中國古詩詞生成AI,基于華為云AI打造的“樂府”并不是第一個(gè),也不是最后一個(gè)。未來,華為將不斷研發(fā)出更多基于華為云AI技術(shù)打造的創(chuàng)新產(chǎn)品,致力為更多領(lǐng)域、更多客戶提供全新的體驗(yàn)方式。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 阿里影業(yè)入股姚安娜經(jīng)紀(jì)公司:新篇章,新機(jī)遇
- 螞蟻森林再度捐資河北種樹,共筑綠色長城
- 谷歌不打算賤賣自家明星產(chǎn)品:Chrome瀏覽器
- 前體操運(yùn)動(dòng)員吳柳芳抖音賬號(hào)再遭封禁,副總裁回應(yīng):尊重規(guī)則,公正處理
- 李想談Robotaxi與人工智能超跑:理想不會(huì)盲目追求,2030年或推出深思熟慮之作
- 小米SU7冬季電車?yán)m(xù)航挑戰(zhàn):追求續(xù)航王之路,挑戰(zhàn)極限低溫
- 趙明解析降價(jià)風(fēng)波:讓行業(yè)回歸本質(zhì),聚焦消費(fèi)者價(jià)值
- 京東物流東京新倉啟用:機(jī)器人助力物流升級(jí),效率提升翻番
- 李想:從德國造到中國造,智能汽車時(shí)代的變遷
- 臺(tái)積電領(lǐng)先一步,iPhone 17錯(cuò)失最先進(jìn)制程,2nm競賽又落后了
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。