信也科技受邀參加國際AI頂會IJCAI 2022 共享DGraph大規(guī)模動態(tài)圖數(shù)據(jù)集

近日,人工智能領域頂級國際學術會議IJCAI 2022在奧地利維也納成功召開。信也科技受邀參會,并通過線上參與的方式發(fā)表了題為《DGraph:A Large-Scale Financial Benchmark for Graph Anomaly Detection》的演講,分享了信也科技聯(lián)合浙江大學發(fā)布的大規(guī)模動態(tài)圖數(shù)據(jù)集DGraph,以助力推動整個圖領域的發(fā)展,為人工智能創(chuàng)新發(fā)展貢獻自己的一份力量。

信也科技首席科學家王春平指出,當前圖領域正在經(jīng)歷算法繁榮期,新算法的提出相當活躍,實際落地場景與公開用于學術領域的數(shù)據(jù)集逐漸豐富。然而,現(xiàn)實場景的復雜度遠超現(xiàn)有公開數(shù)據(jù)的復雜度,尤其是圖的異常檢測(GraphAnomalyDetection,GAD)領域,極度缺乏大規(guī)模、異常比例較低的數(shù)據(jù)集。

信也科技首席科學家王春平分享

本次面向學術研究領域公開的數(shù)據(jù)集DGraph,來自于真實的金融業(yè)務場景,節(jié)點數(shù)超過370萬,是此前常用的GAD領域大規(guī)模數(shù)據(jù)集Elliptic的17倍;它的異常節(jié)點比例低于2%,遠低于主流GAD數(shù)據(jù)集。很重要的是,DGraph保留了邊的時間信息,從而反映了整個圖結構隨著時間的變化,填補了帶有節(jié)點特征、邊特征的動態(tài)圖空白。此外,DGraph還保留了真實場景中數(shù)據(jù)的復雜性。比如,它包含超過200萬不作為預測目標但與目標節(jié)點可能有千絲萬縷聯(lián)系的背景節(jié)點;它的節(jié)點特征帶有大量的缺失值。這些特點可以幫助對算法進行真刀真槍的打磨。

大規(guī)模動態(tài)圖數(shù)據(jù)集DGraph

此前IJCAI 2022公開數(shù)據(jù)顯示,此次大會共收到來自全球的4535篇論文投稿,最終接收率僅為15%。信也科技與浙江大學聯(lián)合提交的論文《Beyond Homophily:Structure-aware Path Aggregation Graph Neural Network》成功入選,應邀參加此次大會分享。該論文突破了經(jīng)典圖神經(jīng)網(wǎng)絡的同質(zhì)性約束,拓展提升了圖神經(jīng)網(wǎng)絡的表達能力,對于反欺詐、反洗錢、AI芯片設計等具有異質(zhì)傾向的圖數(shù)據(jù)領域都具有潛在的應用價值。

一直以來,信也科技始終保持對科技研發(fā)的關注與投入,不僅在業(yè)務應用落地方面,在人工智能學術產(chǎn)出方面也是碩果累累。僅在圖算法領域,信也科技聯(lián)合浙江大學、UCLA等高校先后在CKIM、TKDE、AAAI等人工智能頂級學術會議、期刊發(fā)表了多篇論文,聚焦的內(nèi)容從圖的GAD場景有效應用,到圖的魯棒性和攻擊對抗、預訓練和泛化性等更為基礎的問題,得到了國際同行越來越多的認可。

此次發(fā)布公開數(shù)據(jù)集DGraph,濃縮了信也科技在圖領域的觀察和嘗試,旨在提供更為有挑戰(zhàn)的動態(tài)GAD數(shù)據(jù),激發(fā)更多有價值問題的提出,推動整個圖算法領域的發(fā)展。這標志著信也科技在人工智能領域的研究進程中取得了重要的階段性成果,也展示出信也科技持續(xù)對科技進行投入的誠意和信心。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )