海量數(shù)據(jù)下,八戒知識產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

移動互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。

然而,即使是技術(shù)最為完善的文字搜索,往往也有其乏力的地方。比如,對于商標(biāo)圖片,如果你不知道編碼,蒼白的文字描述是很難幫你正確檢索到你需要知道的商標(biāo)圖形的。而此時,你就需要“以圖搜圖”的功能來實(shí)現(xiàn)。

正是發(fā)現(xiàn)這一市場痛點(diǎn),八戒知識產(chǎn)權(quán)在2016年開始了商標(biāo)圖形檢索系統(tǒng)的研發(fā),并于2017年1月成功上線。

海量數(shù)據(jù)下,八戒知識產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

  商標(biāo)檢索結(jié)果頁面

告別繁復(fù)的檢索

近年來,隨著雙創(chuàng)浪潮的推動,以及品牌意識的逐步增強(qiáng),企業(yè)對商標(biāo)的重視程度可謂逐年提高。有數(shù)據(jù)顯示,2016年國內(nèi)商標(biāo)申請注冊量為350萬件,年增速超過20%。隨著創(chuàng)業(yè)公司激增和品牌意識增強(qiáng),商標(biāo)申請量將繼續(xù)攀升,僅2018年全國商標(biāo)注冊申請量就超過700萬件。

由于商標(biāo)在注冊過程中需要進(jìn)行唯一性審查,所以檢索重復(fù)商標(biāo)就成了商標(biāo)注冊代理機(jī)構(gòu)的首要工作。就商業(yè)領(lǐng)域而言,商標(biāo)包括文字、圖形、字母、數(shù)字、三維標(biāo)志和顏色組合。以往,大部分代理都采用白兔系統(tǒng)。但該系統(tǒng)僅能檢索文字商標(biāo),對于復(fù)雜的圖形商標(biāo),工作人員只能通過人工審查的方式進(jìn)行,而用圖形內(nèi)容檢索的方式則無疑更加高效。

盡管包括Google、百度等搜索引擎均提供以圖搜圖功能,但因圖像相似度判別復(fù)雜度的影響,圖像檢索需要區(qū)分場景才能獲得最佳效果。由于商標(biāo)圖形數(shù)據(jù)非常獨(dú)特,所以直接利用搜索引擎已有的圖形檢索,其結(jié)果往往無法滿足使用者需求。

八戒知識產(chǎn)權(quán)商標(biāo)圖形檢索系統(tǒng)負(fù)責(zé)人王豪杰介紹,圖形商標(biāo)搜索包含三步:識別、理解和檢索。在提取特征點(diǎn)進(jìn)行基礎(chǔ)識別之后,搜索系統(tǒng)需要通過深度學(xué)習(xí)算法對圖片進(jìn)行理解,找到相對精確的備選圖形,隨后通過檢索按照相似度排序?yàn)橛脩籼峁┳罘蠗l件的圖形商標(biāo)。

“一般而言,圖片搜索的運(yùn)算量至少是文字搜索運(yùn)算量的千倍以上,加上圖形搜索比較重視搜索場景,因此對硬件系統(tǒng)和軟件系統(tǒng)要求很高。而圖形商標(biāo)由于抽象化、非標(biāo)準(zhǔn)化等特性,也使得這項(xiàng)技術(shù)比人臉?biāo)阉鞯葓D形搜索難度要更大,研發(fā)周期也更長。”王豪杰說。

但這不符合創(chuàng)業(yè)者分秒必爭態(tài)度,所以,八戒知識產(chǎn)權(quán)希望利用圖像比較技術(shù)和搜索引擎技術(shù),研發(fā)出了一套符合商標(biāo)審查、準(zhǔn)確、高效的商標(biāo)圖形檢索系統(tǒng)。

海量數(shù)據(jù)下,八戒知識產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?

  商標(biāo)圖形檢索系統(tǒng)界面

跨入只需3秒的以圖搜圖時代

傳統(tǒng)商標(biāo)審查需人工判別:630多萬個圖形商標(biāo)按照1806種圖形要素分類,將每個要素下的商標(biāo)與需判別的商標(biāo)進(jìn)行比對,以此判斷商標(biāo)申請是否通過。

由于商標(biāo)局審查員對于近似商標(biāo)的判定具有較大的自由裁量權(quán),八戒知識產(chǎn)權(quán)在深入了解審查原則和審查員習(xí)慣的基礎(chǔ)上,利用專業(yè)的圖像比較技術(shù)和搜索引擎技術(shù),對商標(biāo)圖像進(jìn)行了視覺分析及特征提取,并對數(shù)據(jù)庫的數(shù)百萬張圖像特征創(chuàng)建了數(shù)據(jù)索引。在查詢時,自動對檢索結(jié)果進(jìn)行優(yōu)化排序,并在輸出結(jié)果后提供了多種可自定義的篩選與條件過濾等功能。

經(jīng)過一年的時間,團(tuán)隊(duì)五個技術(shù)成員,迭代了十幾版,目前八戒知識產(chǎn)權(quán)已將搜索系統(tǒng)運(yùn)算速度從3分鐘壓縮到3秒以內(nèi),系統(tǒng)也由原來按照圖形商標(biāo)1806種要素搜索改變?yōu)槿珟焖阉?,搜索結(jié)果的錯誤率在5%以內(nèi)。

同時,通過優(yōu)化核心算法,使硬件成本降低了30%,現(xiàn)在用7臺服務(wù)器可以實(shí)現(xiàn)原來運(yùn)行十臺服務(wù)器的效果,降低了項(xiàng)目的運(yùn)維成本。

如今,八戒知識產(chǎn)權(quán)的商標(biāo)圖形檢索系統(tǒng),有著領(lǐng)先的圖片檢索技術(shù),以圖搜圖只需要將目標(biāo)圖片上傳,一鍵檢索即可找到相似商標(biāo)圖形詳細(xì)信息,還可以對結(jié)果進(jìn)行篩選,使得你找到更加精確的結(jié)果,不但節(jié)約的商標(biāo)檢索的時間也大大提高了商標(biāo)申請的通過率。

現(xiàn)在圖形商標(biāo)搜索市場各路玩家陸續(xù)加入,從傳統(tǒng)的機(jī)構(gòu)如國方、集佳、社文到新興的互聯(lián)網(wǎng)機(jī)構(gòu),比如智慧芽,還有產(chǎn)業(yè)投資密集并購。大家齊頭并進(jìn),暫未出現(xiàn)一家獨(dú)大的局面。

對于來自領(lǐng)域內(nèi)蜂擁而至的競爭,王豪杰認(rèn)為這并非壞事。“任何市場都有競爭,競爭一方面可以壓迫自身的不斷發(fā)展,另一方面也可以促進(jìn)市場的繁榮。而最重要的,其實(shí)不是市場有多大,而是自己能吃下的蛋糕有多大。”

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-15
海量數(shù)據(jù)下,八戒知識產(chǎn)權(quán)是如何解決“以圖搜圖”難題的?
移動互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。然而,即使是技術(shù)最為完善的文字搜索,往往也有其乏力的地方。

長按掃碼 閱讀全文