你看到的專利數(shù)據(jù)里,隱藏著智慧芽分類號全新突破

近日,科技創(chuàng)新情報SaaS服務(wù)商智慧芽宣布,其數(shù)據(jù)庫中的專利分類號在兩方面取得重大突破——專利分類號說明精準(zhǔn)翻譯、CPC智能補全,全面幫助用戶提升專利檢索的便利性和準(zhǔn)確性,提升用戶效率。

一直以來,業(yè)內(nèi)使用的專利分類號面臨的兩大痛點:一是大量分類號缺少精準(zhǔn)的中文解釋說明,用戶無法清晰明白專利號的非中文準(zhǔn)確含義;二是全球近1.7億條專利中,近四成專利缺少CPC分類信息,這些專利無法從分類號上判斷其領(lǐng)域特征。智慧芽在專利數(shù)據(jù)分類號中的重大突破,開創(chuàng)性解決了業(yè)內(nèi)這兩大難題。

如何解決這兩大難題?智慧芽技術(shù)副總裁屠昶旸解釋到:“第一,智慧芽聘請專業(yè)人士,人工翻譯了超78萬條分類號;第二借助機器學(xué)習(xí)等人工智能技術(shù),對5000多萬條未覆蓋CPC分類的專利進行補全,完善其CPC分類,大幅提升產(chǎn)品用戶體驗。”

突破一:專業(yè)人士翻譯78萬條分類號說明

由于專利分類號環(huán)環(huán)相扣、互相補充,加上分類號中存在較多行業(yè)性和專業(yè)性詞匯,使得機器翻譯分類號說明準(zhǔn)確性相對較低。智慧芽邀請不同領(lǐng)域知識產(chǎn)權(quán)專業(yè)人士,對海量分類號進行一一人工翻譯,確保分類號說明的準(zhǔn)確性,使翻譯后的分類號中文說明同樣能夠相互包含,易于理解。

除了內(nèi)容難度之外,龐大的分類號數(shù)量,也增加了分類號翻譯的難度。當(dāng)前,智慧芽還實現(xiàn)了17萬條UPC英文的翻譯、20萬條FI和41萬條F-term的日文翻譯,使得專利檢索更加全面,可以更好地服務(wù)客戶。


圖1:UPC分類號


圖2:FI分類號

圖3:F-term分類號

突破二:智能技術(shù)補全5000萬條CPC

CPC分類號是進行專利檢索分析的重要工具,但由于CPC分類號是2010年才發(fā)布使用,部分國家/地區(qū)/組織才逐漸采用CPC分類號,因此導(dǎo)致有近四成專利未覆蓋CPC分類號信息,影響專利檢索結(jié)果的全面性。

圖4:CPC分類號預(yù)測

圖5:支持檢索預(yù)測的CPC分類號

智慧芽通過人工智能機器學(xué)習(xí)技術(shù),將文本信息和已有分類號作為訓(xùn)練數(shù)據(jù)進行機器學(xué)習(xí),構(gòu)建分類號預(yù)測模型。對缺失CPC、存在摘要或權(quán)利要求的專利進行CPC分類補全,進而提高用戶使用CPC檢索結(jié)果的準(zhǔn)確性。當(dāng)前,智慧芽已經(jīng)實現(xiàn)CPC的覆蓋度從59%提高到 95%。

未來,智慧芽將腳步不止,不斷迭代產(chǎn)品功能,持續(xù)更好地服務(wù)用戶。

文末福利,掃碼領(lǐng)取

數(shù)據(jù)庫7天免費試用權(quán)限

*申請成功后,我們會在2個工作日內(nèi)幫您開通賬號

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )