螞蟻集團發(fā)布AI安全檢測平臺蟻鑒2.0,可實現(xiàn)用生成式能力檢測生成式模型

7月7日消息,7日,2023世界人工智能大會(WAIC2023)“聚焦·大模型時代AIGC新浪潮—可信AI”論壇舉行,螞蟻集團聯(lián)合清華大學發(fā)布AI安全檢測平臺“蟻鑒2.0”。

蟻鑒2.0可實現(xiàn)用生成式AI能力檢測生成式AI模型,可識別數(shù)據(jù)安全、內(nèi)容安全、科技倫理三大類的數(shù)百種風險,覆蓋表格、文本、圖像等多種數(shù)據(jù)和任務(wù)類型,是業(yè)內(nèi)首個實現(xiàn)產(chǎn)業(yè)級應用的全數(shù)據(jù)類型AI安全檢測平臺。據(jù)了解,該產(chǎn)品還入選了本屆大會的“鎮(zhèn)館之寶”。

在該論壇上,螞蟻集團同時宣布,“蟻鑒2.0”全面開放,面向全球開發(fā)者免費提供AIGC安全性、AI可解釋性、AI魯棒性三項檢測工具,可服務(wù)于數(shù)字金融、教育、文化、醫(yī)療、電商等領(lǐng)域的大規(guī)模復雜業(yè)務(wù)場景。

據(jù)了解,“蟻鑒2.0”的兩項硬核能力,一是實現(xiàn)了用生成式能力檢測生成式模型。檢測標準覆蓋內(nèi)容安全、數(shù)據(jù)安全、倫理安全三大類,可對大模型生成式內(nèi)容完成包含個人隱私、意識形態(tài)、違法犯罪、偏見與歧視等數(shù)百個維度的風險對抗檢測,并會生成檢測報告,幫助大模型更加有針對性地持續(xù)優(yōu)化。

另一項硬核能力是,“蟻鑒2.0”融入了可解釋性檢測工具。綜合AI技術(shù)和專家先驗知識,通過可視化、邏輯推理、因果推斷等技術(shù),從完整性、準確性、穩(wěn)定性等7個維度及20余項評估指標,對AI系統(tǒng)的解釋質(zhì)量量化分析,幫助用戶更清晰驗證與優(yōu)化可解釋方案。

據(jù)了解,“蟻鑒2.0”集成了螞蟻近10年可信AI實踐、1000余項可信AI專利,支持零編碼測評。開發(fā)者通過API接口,將AI模型接入蟻鑒,就可以一鍵識別和挖掘模型漏洞。

螞蟻集團認為,人工智能的深度應用,不僅對數(shù)據(jù)、算法、算力提出了更高要求,也對安全、隱私、倫理提出更多挑戰(zhàn)。在確保數(shù)據(jù)安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術(shù)真正地釋放應用價值。

此次論壇上,中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發(fā)起的《AIGC可信倡議》。該倡議得到數(shù)十家單位參與,圍繞人工智能可能引發(fā)的經(jīng)濟、安全、隱私和數(shù)據(jù)治理等問題,提出構(gòu)建AIGC可信發(fā)展的全球治理合作框架,采用安全可信的數(shù)據(jù)資源、技術(shù)框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。

論壇現(xiàn)場還發(fā)布了由中國信通院、清華大學、螞蟻集團聯(lián)合編纂的《可信AI技術(shù)和應用進展白皮書(2023)》。該報告基于統(tǒng)一的可信AI認知維度,梳理總結(jié)可信AI發(fā)展現(xiàn)狀,提練了面向新階段大模型和AIGC引發(fā)的新需求,形成以技術(shù)為保障的可信AI評估體系和工具,探索新一代可信人工智能發(fā)展。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-07
螞蟻集團發(fā)布AI安全檢測平臺蟻鑒2.0,可實現(xiàn)用生成式能力檢測生成式模型
該產(chǎn)品還入選了本屆大會的“鎮(zhèn)館之寶”。

長按掃碼 閱讀全文