原標(biāo)題:看筆跡識國籍?一起來看AI加持下的筆跡識別進(jìn)化之路
筆者高中時期,班里有一條完整的“假條產(chǎn)業(yè)鏈”。有人負(fù)責(zé)在外面打印店打印假條,有人負(fù)責(zé)模仿政教處主任簽字,有人負(fù)責(zé)模仿班主任簽字,還有人負(fù)責(zé)畫政教處的印章。幾個人功夫了得,每張假條5毛錢,出門成功率幾乎高達(dá)百分之百。
當(dāng)然,有人造假就有人打假。不知是誰走漏了風(fēng)聲(很可能是班主任安排的內(nèi)奸),在某一個時間節(jié)點(diǎn)門衛(wèi)突然開始嚴(yán)查假請假條,重點(diǎn)識別我們班的“工業(yè)流水產(chǎn)品”,導(dǎo)致出門成功率直線下降。假條沒了市場,幾個人又怕被查到,于是金盆洗手,火熱的假條交易從此就落下了帷幕。此后沉渣雖又泛起了幾次,但再也成不了氣候了。
這充分說明,造假,尤其是筆跡造假這事兒其實(shí)挺簡單的,但要不認(rèn)真看的話也很難辨別真?zhèn)?。學(xué)生尚且能如此,遑論那些專業(yè)的筆跡造假人員,簽字、印章造假之事更是層出不窮。自然,在識別筆跡這件事兒上,人們也是下足了功夫。
分辨真假:傳統(tǒng)筆跡識別的力之所及
筆跡識別其實(shí)是一件難度很高的事情。當(dāng)然,這里討論的主要是涉及到重要利益問題時候的筆跡造假。這種情況下,肯定不會找一些畫虎類貓的人隨隨便便就把別人名字給寫上去了,要找也得是有過專門的模仿經(jīng)驗(yàn)的專業(yè)人員。
那么,在這種情況下,想要用肉眼就辨別真?zhèn)?,就真的有點(diǎn)兒勉為其難了。因此,除了神奇的古人,要想讓識別字跡這事兒變得靠譜,只能是借助計(jì)算機(jī)了。
筆跡識別的難點(diǎn)在于,其可供分析的樣本較少,因此難以建立有效的字跡對比模型。比如,對識別真假簽名,上哪兒去找那么多名字呢?人家也不可能處處留名。
因此,對筆跡的識別流程往往比較復(fù)雜,目前來說主要包括分別檢驗(yàn)兩種筆跡的運(yùn)筆自然程度、大小、字形結(jié)構(gòu),確定兩種筆跡的特征,然后進(jìn)行比較各種特征的異同,最終做出綜合判斷。在人力時代,進(jìn)行比較的時候以目力觀察為主,常常需要借助攝影儀、顯微鏡、幻燈片等進(jìn)行對比研究。
清華大學(xué)和公安部曾經(jīng)推出一款能自動鑒別筆跡的“計(jì)算機(jī)筆跡識別系統(tǒng)”,其能將整個檢驗(yàn)、對比和判斷的過程自動化,對筆跡識別精準(zhǔn)度的提升有很大的作用。
另外一個涉及到辨別真?zhèn)蔚姆绞絼t是對筆跡的時間進(jìn)行推斷。我們在電視上經(jīng)常會看到有人拿著借條聲稱某人借錢不還,但實(shí)際上簽名卻是新的。這里就用到了書寫時間鑒定的技術(shù)。
目前來說,可以做到通過對墨水成分的鑒定來看是否為同一支筆;通過墨跡的對墨水的溶解率的檢測判斷書寫時間;并且在有公章的情況下,可以檢測公章和簽字的覆蓋關(guān)系。
但是受限于文件的存放時間、存放條件、墨水的材料等諸多因素,鑒定的結(jié)果也會受到影響。以目前的技術(shù)而言,受這些因素的影響,其時間精確的誤差可從幾天大到幾個月之間。
可以看出的是,傳統(tǒng)的筆跡識別主要是停留在辨別真?zhèn)蔚膶用?。由于技術(shù)條件的限制,其精準(zhǔn)度有待提高,作為證據(jù)采用的可信度自然尚需斟酌。但相比手工時代輕易的魚目混珠,利用計(jì)算機(jī)來進(jìn)行筆跡識別和判斷墨跡時間已經(jīng)是一個非常大大的進(jìn)步了。
當(dāng)然,永不滿足的人類還想要更大的進(jìn)步。
從看人格到定國籍:AI時代的筆跡識別新大陸
對解決傳統(tǒng)的筆跡識別問題,AI或許可以幫上一點(diǎn)忙。雖然AI也需要充分的樣本學(xué)習(xí)才能建立較為準(zhǔn)確對比模型,但在同樣的數(shù)據(jù)條件下,AI的深度學(xué)習(xí)能力能幫助其作出相對更精準(zhǔn)的判斷。
而AI的重要意義不僅僅在于緩解傳統(tǒng)筆跡識別的問題,更在于其為筆跡識別開發(fā)出了新的可能。
1. 人格預(yù)測。Sinhgad Institute of Technology的研究人員們通過對單詞的頁邊距(在固定網(wǎng)格中的位置)、單詞間距、行距等幾個方面進(jìn)行切割分析過筆壓、大小、邊距、字體區(qū)域、傾斜程度、基線等進(jìn)行特征提取,然后將其分類,并分析其不同類別與人格、情感的關(guān)系。在經(jīng)過學(xué)習(xí)之后,系統(tǒng)可以在最短的時間內(nèi)進(jìn)行情緒的識別和人格的預(yù)測,從而提高人格預(yù)測的準(zhǔn)確性。
2. 國籍識別。一個由中國、馬來西亞和印度研究人員組成的研究小組則將字體作為與虹膜、面部等有相通作用的生物特征的一種,以此來判斷其國籍、性別等,從而來查明涉及不同國家國民的罪行。
在方法上,其通過對中國、印度、馬拉西亞、伊朗和孟加拉國等五個亞洲國家的100位作家的書寫英文的字跡進(jìn)行分析,利用一種名為cold的線性分布識別工具,從線條、傾斜方向、整體形狀等方面來對AI系統(tǒng)進(jìn)行訓(xùn)練學(xué)習(xí)。比如中國人漢字橫平豎直,因此寫英文的時候呈現(xiàn)出線條偏硬的特征;而印度和孟加拉國寫字則偏圓潤。除此之外,100位作家中還有10位女性,因此其還順便測試了一把男女的差別。
如果說僅僅辨別真假還是初階的話,那用AI通過識別字體能夠判斷人的性格乃至國籍就有點(diǎn)一步躍升到高階的味道了。而從另一個角度來說,這也有一定的科學(xué)依據(jù)。畢竟,在之前曾有人研發(fā)出AI的步態(tài)識別技術(shù),通過一個人的姿勢來判斷人,說明這種生物行為在每個人身上都是不一樣的。那么,寫字作為動作的一種,人的性格、生理等諸多因素也很可能會對它產(chǎn)生影響。
而中國人也常說,“字如其人”,這句話在今天看來,算是找到了科學(xué)依據(jù)。
但無論是人格判斷還是國籍識別,其都尚且只是停留在論文或?qū)嶒?yàn)室層面,要想走入現(xiàn)實(shí),恐怕仍然有很長的一段路。
以筆為矛:小筆跡下的大用處
當(dāng)想象的邊界被AI無限延展,筆跡識別也將突破原有的狹窄應(yīng)用區(qū)域。僅僅做辨別真假這事兒就顯得有點(diǎn)太低端,至少下面的這些事情,未來將有可能搭上筆跡識別的快車。
1. 法務(wù)判斷的參考。通過對字跡的國籍、性別的判斷,對犯罪嫌疑人的鎖定和篩選范圍也將縮小,有利于節(jié)省大量的篩查排除時間。而據(jù)《民事訴訟法》規(guī)定,鑒定結(jié)論也屬于證據(jù)的一種。那么在利益關(guān)系比較突出的經(jīng)濟(jì)案件中,筆跡識別精準(zhǔn)度的提高,也將提高法官對案情的判斷能力。
2. 心理疾病的診斷。在心理診斷中,目前多是采用對話的形式。如果可以大量搜集心理疾病患者的字體,然后用機(jī)器學(xué)習(xí)的方法對其進(jìn)行分析和建模,則可以為心理疾病的診斷提供又一強(qiáng)大的判斷依據(jù)。再結(jié)合原有的對話、測試等手段,心理疾病的診斷正確率有可能會隨之大大提高。比如患有精神分裂癥的人,其常常會自造字詞,文字的布局混亂、留白和間距小、字跡潦草等特征明顯,總體呈現(xiàn)出混亂而不規(guī)范的特點(diǎn)。
3. 生理疾病的輔助。有研究表明,筆跡里其實(shí)隱藏生理疾病的密碼。比如帕金森病人的字會越寫越小,并且字跡會很淺;阿爾茨海默癥則呈現(xiàn)書寫缺乏規(guī)律;高血壓病字跡會重……這對于提早發(fā)現(xiàn)病情,及時預(yù)防和治療將起到重要作用。
值得注意的是,一旦涉及到診斷疾病,那就要謹(jǐn)防有江湖騙子趁此機(jī)會發(fā)不義之財了……
4. 收藏品的鑒別。收藏有風(fēng)險,入行須謹(jǐn)慎。收藏界最怕的事兒就是買到假貨。有的文盲喜歡買幾幅名家字畫往家里客廳里一掛,順便附庸個風(fēng)雅。一旦買到贗品,被行家識破后丟人事小,白花花的銀子就這么扔了就可惜了。那么,在入手之前對字畫識別一番,既能對筆跡進(jìn)行分辨,還能對墨跡進(jìn)行檢測,媽媽再也不擔(dān)心自己被騙了。當(dāng)然,賣假貨的可能會堅(jiān)決抵制,理由是擾亂了假貨市場秩序……
可見,筆跡雖小,卻也有大用處。這也是AI的神奇之處。它令一些已知可能得到升級,又將未知的不可能的事情變成了現(xiàn)實(shí)。它時不時扔出來一件足以令我們咋舌的事情,卻也讓我們看到了AI之于這個偉大時代的意義。
當(dāng)然,以后再想模仿班主任簽名,可能連門兒都沒有了。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計(jì)劃裁員2500人,應(yīng)對航天業(yè)務(wù)虧損與供應(yīng)鏈挑戰(zhàn)
- 科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)發(fā)展:江陰市與清華大學(xué)攜手推進(jìn)重大科技項(xiàng)目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強(qiáng)東章澤天報案:京東發(fā)言人證實(shí)夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務(wù)
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設(shè)立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。