近日,人工智能領(lǐng)域頂級國際學(xué)術(shù)會議IJCAI 2022在奧地利維也納成功召開。信也科技受邀參會,并通過線上參與的方式發(fā)表了題為《DGraph:A Large-Scale Financial Benchmark for Graph Anomaly Detection》的演講,分享了信也科技聯(lián)合浙江大學(xué)發(fā)布的大規(guī)模動態(tài)圖數(shù)據(jù)集DGraph,以助力推動整個圖領(lǐng)域的發(fā)展,為人工智能創(chuàng)新發(fā)展貢獻自己的一份力量。
信也科技首席科學(xué)家王春平指出,當(dāng)前圖領(lǐng)域正在經(jīng)歷算法繁榮期,新算法的提出相當(dāng)活躍,實際落地場景與公開用于學(xué)術(shù)領(lǐng)域的數(shù)據(jù)集逐漸豐富。然而,現(xiàn)實場景的復(fù)雜度遠(yuǎn)超現(xiàn)有公開數(shù)據(jù)的復(fù)雜度,尤其是圖的異常檢測(GraphAnomalyDetection,GAD)領(lǐng)域,極度缺乏大規(guī)模、異常比例較低的數(shù)據(jù)集。
信也科技首席科學(xué)家王春平分享
本次面向?qū)W術(shù)研究領(lǐng)域公開的數(shù)據(jù)集DGraph,來自于真實的金融業(yè)務(wù)場景,節(jié)點數(shù)超過370萬,是此前常用的GAD領(lǐng)域大規(guī)模數(shù)據(jù)集Elliptic的17倍;它的異常節(jié)點比例低于2%,遠(yuǎn)低于主流GAD數(shù)據(jù)集。很重要的是,DGraph保留了邊的時間信息,從而反映了整個圖結(jié)構(gòu)隨著時間的變化,填補了帶有節(jié)點特征、邊特征的動態(tài)圖空白。此外,DGraph還保留了真實場景中數(shù)據(jù)的復(fù)雜性。比如,它包含超過200萬不作為預(yù)測目標(biāo)但與目標(biāo)節(jié)點可能有千絲萬縷聯(lián)系的背景節(jié)點;它的節(jié)點特征帶有大量的缺失值。這些特點可以幫助對算法進行真刀真槍的打磨。
大規(guī)模動態(tài)圖數(shù)據(jù)集DGraph
此前IJCAI 2022公開數(shù)據(jù)顯示,此次大會共收到來自全球的4535篇論文投稿,最終接收率僅為15%。信也科技與浙江大學(xué)聯(lián)合提交的論文《Beyond Homophily:Structure-aware Path Aggregation Graph Neural Network》成功入選,應(yīng)邀參加此次大會分享。該論文突破了經(jīng)典圖神經(jīng)網(wǎng)絡(luò)的同質(zhì)性約束,拓展提升了圖神經(jīng)網(wǎng)絡(luò)的表達能力,對于反欺詐、反洗錢、AI芯片設(shè)計等具有異質(zhì)傾向的圖數(shù)據(jù)領(lǐng)域都具有潛在的應(yīng)用價值。
一直以來,信也科技始終保持對科技研發(fā)的關(guān)注與投入,不僅在業(yè)務(wù)應(yīng)用落地方面,在人工智能學(xué)術(shù)產(chǎn)出方面也是碩果累累。僅在圖算法領(lǐng)域,信也科技聯(lián)合浙江大學(xué)、UCLA等高校先后在CKIM、TKDE、AAAI等人工智能頂級學(xué)術(shù)會議、期刊發(fā)表了多篇論文,聚焦的內(nèi)容從圖的GAD場景有效應(yīng)用,到圖的魯棒性和攻擊對抗、預(yù)訓(xùn)練和泛化性等更為基礎(chǔ)的問題,得到了國際同行越來越多的認(rèn)可。
此次發(fā)布公開數(shù)據(jù)集DGraph,濃縮了信也科技在圖領(lǐng)域的觀察和嘗試,旨在提供更為有挑戰(zhàn)的動態(tài)GAD數(shù)據(jù),激發(fā)更多有價值問題的提出,推動整個圖算法領(lǐng)域的發(fā)展。這標(biāo)志著信也科技在人工智能領(lǐng)域的研究進程中取得了重要的階段性成果,也展示出信也科技持續(xù)對科技進行投入的誠意和信心。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )