劍橋量子發(fā)布世界首個(gè)量子自然語言處理工具包和庫Lambeq

10月13日消息(余予)劍橋量子(Cambridge Quantum,CQ)日前宣布發(fā)布世界首個(gè)量子自然語言處理(QNLP)工具包和庫。該工具包被稱為L(zhǎng)ambeq,以已故數(shù)學(xué)家和語言學(xué)家 Joachim Lambek 的名字命名。

Lambeq是世界上首個(gè)能夠?qū)⒕渥愚D(zhuǎn)換為量子電路的QNLP 軟件工具包,旨在加速實(shí)際的、真實(shí)的QNLP 應(yīng)用的開發(fā),例如自動(dòng)對(duì)話、文本挖掘、語言翻譯、文本到語音、語言生成和生物信息學(xué)。

Lambeq在完全開源的基礎(chǔ)上發(fā)布,以造福世界量子計(jì)算社區(qū)和快速增長(zhǎng)的量子計(jì)算研究人員、開發(fā)人員和用戶生態(tài)系統(tǒng)。 Lambeq與CQ 的TKET無縫合作,TKET是世界領(lǐng)先且發(fā)展最快的量子軟件開發(fā)平臺(tái),同時(shí)也是完全開源。這為QNLP開發(fā)人員提供了訪問盡可能廣泛的量子計(jì)算機(jī)的權(quán)限。

Lambeq由CQ 位于牛津的量子計(jì)算研究團(tuán)隊(duì)構(gòu)思、設(shè)計(jì)和設(shè)計(jì),該團(tuán)隊(duì)由首席科學(xué)家Bob Coecke領(lǐng)導(dǎo),資深科學(xué)家Dimitrios Kartsaklis 博士擔(dān)任該平臺(tái)的首席架構(gòu)師。

據(jù)悉,Lambeq和更廣泛的QNLP是一個(gè)研究項(xiàng)目的結(jié)果,這可以追溯到十多年前。

“我們的團(tuán)隊(duì)一直在從事基礎(chǔ)工作,探索如何使用量子計(jì)算機(jī)來解決人工智能中一些最棘手的問題,”Coecke表示,“這項(xiàng)工作是基于我、Steve Clark(現(xiàn)任CQ的人工智能負(fù)責(zé)人)和其他人最先開創(chuàng)的進(jìn)展。NLP處于這些調(diào)查的核心。幾個(gè)月前我們發(fā)布了世界上首個(gè)由CQ在實(shí)際量子計(jì)算機(jī)上實(shí)現(xiàn)QNLP的細(xì)節(jié),并在2019年12月首次披露了基本原理,而Lambeq是繼幾個(gè)月前發(fā)布之后自然而然的下一步。”

“在過去一年發(fā)表的多篇論文中,”Coecke補(bǔ)充道,“我們不僅提供了有關(guān)量子計(jì)算機(jī)如何增強(qiáng)NLP 的詳細(xì)信息,而且還證明了QNLP 是‘量子本源’,這意味著控制語言的組成結(jié)構(gòu)在數(shù)學(xué)上與管理量子系統(tǒng)的結(jié)構(gòu)相同。最終這將使世界擺脫目前依賴于不透明和近似的蠻力技術(shù)的人工智能模式。”

Lambeq能夠?qū)崿F(xiàn)CQ 科學(xué)家之前描述的成分分布 (DisCo) 型NLP實(shí)驗(yàn)的設(shè)計(jì)和部署并實(shí)現(xiàn)自動(dòng)化。這意味著從對(duì)文本結(jié)構(gòu)進(jìn)行編碼的語法/語法圖轉(zhuǎn)變?yōu)槭褂肨KET實(shí)現(xiàn)的(經(jīng)典)張量網(wǎng)絡(luò)或量子電路,以便針對(duì)文本分類等機(jī)器學(xué)習(xí)任務(wù)進(jìn)行優(yōu)化。

同時(shí),Lambeq采用模塊化設(shè)計(jì),用戶可以在模型中交換組件,并在架構(gòu)設(shè)計(jì)上具有靈活性。

除此之外,Lambeq 消除了專注于人工智能和人機(jī)交互的從業(yè)者和研究人員的進(jìn)入壁壘,這可能是量子技術(shù)最重要的應(yīng)用之一。目前,TKET已在全球范圍內(nèi)擁有了數(shù)十萬用戶群。

Lambeq有潛力成為量子計(jì)算社區(qū)尋求參與QNLP應(yīng)用程序的最重要工具包,而QNLP 應(yīng)用是人工智能最重要的市場(chǎng)之一。最近一個(gè)很明顯的關(guān)鍵點(diǎn)是,QNLP也將適用于基因組學(xué)和蛋白質(zhì)組學(xué)中出現(xiàn)的符號(hào)序列分析。

作為L(zhǎng)ambeq的啟動(dòng)合作伙伴和早期采用者,默克集團(tuán)最近在QNLP發(fā)表了一篇研究論文,作為與慕尼黑技術(shù)大學(xué)創(chuàng)新計(jì)劃量子創(chuàng)業(yè)實(shí)驗(yàn)室項(xiàng)目的一部分。

默克IT 醫(yī)療保健創(chuàng)新孵化器和量子計(jì)算興趣小組聯(lián)合創(chuàng)始人Thomas Ehmer表示,“利用量子計(jì)算的獨(dú)特功能實(shí)現(xiàn)根本性突破是默克研究的重要組成部分。我們最近與慕尼黑工業(yè)大學(xué)的研究人員在QNLP 上公開的項(xiàng)目已經(jīng)證明,即使在現(xiàn)階段,使用QNLP 技術(shù)對(duì)句子進(jìn)行二元分類任務(wù)也可以獲得與現(xiàn)有經(jīng)典方法相當(dāng)?shù)慕Y(jié)果。顯然,圍繞量子計(jì)算的基礎(chǔ)設(shè)施需要改進(jìn),才能將這些技術(shù)用于商業(yè)。關(guān)鍵的是,我們可以看到在QNLP中采用的方法如何為可解釋的AI 開辟道路,從而實(shí)現(xiàn)更準(zhǔn)確、更可靠的智能——這在醫(yī)學(xué)上至關(guān)重要。”

“關(guān)于QNLP 有很多有趣的理論工作,但理論通常與實(shí)踐相距甚遠(yuǎn)。”Kartsaklis 表示,“通過Lambeq,我們讓研究人員有機(jī)會(huì)獲得QNLP 實(shí)驗(yàn)方面的實(shí)踐經(jīng)驗(yàn),這是目前完全未開發(fā)的領(lǐng)域。這是量子硬件上實(shí)用的、真實(shí)的NLP應(yīng)用成為現(xiàn)實(shí)的關(guān)鍵一步。

Lambeq已在GitHub上作為常規(guī)Python存儲(chǔ)庫發(fā)布。迄今為止,lambeq生成的量子電路已在IBM量子計(jì)算機(jī)和霍尼韋爾量子解決方案H系列設(shè)備上執(zhí)行和實(shí)施。

近年來,基于 NLP 的應(yīng)用程序在全球范圍內(nèi)無處不在,從客戶服務(wù)、消費(fèi)者技術(shù)到醫(yī)療保健和廣告。據(jù)行業(yè)分析師預(yù)測(cè),到2028 年,全球NLP市場(chǎng)的價(jià)值預(yù)計(jì)將達(dá)到1272.6 億美元,復(fù)合年增長(zhǎng)率(CAGR)近30%。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-10-13
劍橋量子發(fā)布世界首個(gè)量子自然語言處理工具包和庫Lambeq
劍橋量子發(fā)布世界首個(gè)量子自然語言處理工具包和庫Lambeq,C114訊 10月13日消息(余予)劍橋量子(Cambridge Quantum,CQ)日前宣布發(fā)布

長(zhǎng)按掃碼 閱讀全文