在全球經(jīng)濟(jì)一體化的今天,中文信息科技遍布生活、娛樂、學(xué)習(xí)等各個方面,成為現(xiàn)代人類日常生活不可缺少的重要組成部分。然而,在上個世紀(jì)70年代,讓漢字進(jìn)入計算機(jī)曾一度被認(rèn)為是“不可能完成的任務(wù)”,而王選院士帶領(lǐng)北京大學(xué)計算機(jī)科學(xué)技術(shù)研究所(下稱北大計算機(jī)所)北大科研團(tuán)隊研制的“漢字信息處理與激光照排技術(shù)”,成功破解了這一難題,從此印刷業(yè)從“鉛與火”的時代邁入“光與電”的新紀(jì)元。
然而,成功的背后是王選攻堅克難、默默無聞地付出: 在當(dāng)時,因為國產(chǎn)計算機(jī)速度慢,存貯量小,而漢字的字?jǐn)?shù)多,字號大小不一,又有多種字體,所以如何將信息量龐大的漢字自如地在計算機(jī)中存儲和輸出成為主要技術(shù)難關(guān)。經(jīng)反復(fù)鉆研,王選發(fā)明了“輪廓加參數(shù)”的漢字信息壓縮法和高速復(fù)原技術(shù),使?jié)h字的存儲量被總體壓縮500-1000倍,并實現(xiàn)了漢字字形每秒710字的快速復(fù)原以及變倍和變形時的高度保真,解決了這一世界級的技術(shù)難題。
不僅如此,在王選院士的帶領(lǐng)和精神感召下,團(tuán)隊還研發(fā)出全程數(shù)字化的“報業(yè)數(shù)字資產(chǎn)管理系統(tǒng)”,告別紙與筆、開啟數(shù)字播控的“數(shù)字化音視頻控制技術(shù)研究及應(yīng)用”,擺脫磁帶束縛、“基于數(shù)字版權(quán)保護(hù)的電子圖書出版及應(yīng)用系統(tǒng)”、“跨媒體智能識別技術(shù)”、“個性化字體生成技術(shù)”、“人工智能寫稿機(jī)器人”等前沿科技,其研發(fā)的各項技術(shù)多次促進(jìn)我國相關(guān)行業(yè)實現(xiàn)了技術(shù)變革和產(chǎn)業(yè)顛覆性發(fā)展,產(chǎn)生了重大的社會與經(jīng)濟(jì)效益。
今年是北大建校120周年,也是北大計算機(jī)所建所35周年,記者借此機(jī)會走訪了中國最早的計算機(jī)科學(xué)研究機(jī)構(gòu),也是產(chǎn)業(yè)化落地效果最為顯著的研究機(jī)構(gòu)之一——北京大學(xué)計算機(jī)科學(xué)技術(shù)研究所,與團(tuán)隊成員探討了在現(xiàn)代智能化科技發(fā)展大環(huán)境下,如何堅守“科技頂天、市場立地”的王選精神傳承,堅守科技強(qiáng)國之初心,讓科研技術(shù)服務(wù)大眾生活。
弘揚王選精神,發(fā)展王選事業(yè)
Q:這不斷發(fā)展的35年對北大、對計算機(jī)所有什么意義?
郭宗明(北大計算機(jī)所所長):簡單可以歸納為王選精神在傳承,王選事業(yè)在發(fā)展。王老師的精神有很多,不同人有不同理解,比如好人精神、科研執(zhí)著精神等。從一個單位的角度來講,也就是“頂天立地”,頂天指的是最先進(jìn)的科學(xué)技術(shù),立地就是大范圍科技成果的應(yīng)用。到目前為止我們研究所還是堅持這樣一個作風(fēng),我們要面向應(yīng)用,哪怕是短期沒有應(yīng)用的,長期有應(yīng)用前景的,這也是我們研究所一直堅持的。
首先是做面向應(yīng)用的研究。我們研究所當(dāng)然也做基礎(chǔ)研究,但是我們的特點應(yīng)該還是面向應(yīng)用的研究,也就是我們的研究成果最后都是要落地的。我們也有一些研究成果可能短期內(nèi),或者目前來看,并不一定能用到實踐當(dāng)中,比如所里某些研究成果是面向基于語義的,可能它并沒有一定在哪個行業(yè)里應(yīng)用,但是我們長遠(yuǎn)的目標(biāo)是這樣。再如,所里研究的高考機(jī)器人也是一樣的,高考機(jī)器人背后的核心,背后通用的技術(shù)是人工智能,我們把它摘成一條一條的叫知識點、知識條目。
二是我們的應(yīng)用主要面向媒體,比如說出版、廣播、電視、網(wǎng)絡(luò)媒體等等,當(dāng)然我們不限于媒體,我們也有語言、醫(yī)學(xué)、金融等等合作。但是要說我們特點的話,我們主要是這兩個,一個是面向應(yīng)用的研究,另一個就是應(yīng)用主要在媒體行業(yè)。
結(jié)合新技術(shù)落地應(yīng)用
Q:現(xiàn)在像微軟等企業(yè),他們都有自己的研究院,也是奔著應(yīng)用去的,這個跟北大計算機(jī)所有什么區(qū)別?
趙東巖(北大計算機(jī)所學(xué)術(shù)委員會委員):我覺得服務(wù)對象和立項需求不同。企業(yè)的研究院畢竟是企業(yè)投資來創(chuàng)辦的,自主研發(fā)的知識產(chǎn)權(quán)是為企業(yè)服務(wù)的。而高校研究所,它更強(qiáng)調(diào)通用性,服務(wù)對象更強(qiáng)調(diào)社會普遍性。在展開合作時,不拘泥于某個企業(yè)或單位綁定服務(wù)。所以,我們的研發(fā)確實面臨挑戰(zhàn),但我們的科學(xué)研究能從社會意義、社會發(fā)展角度得到前進(jìn)的動力。
郭宗明:企業(yè)里面資源更豐富,它更偏重一些功能性的東西。北大計算機(jī)所純粹拼資源很難跟企業(yè)比,這種情況逼著我們更注重原創(chuàng)性研究,這是最大的區(qū)別。
Q:原創(chuàng)也很難,計算機(jī)所是怎么開展原創(chuàng)研究的?
彭宇新(北大計算機(jī)所學(xué)術(shù)委員會委員):一些技術(shù)不是想做就能做的,它是需要一個長時間的積累,我們的研究是基于先有積累。比如,我是做圖像視頻、媒體的分析和檢索的,這早在2000年就著手研究了。所以說比較有門檻的項目技術(shù),經(jīng)過長時間積累,做到人無我有的局面就比較有優(yōu)勢。
Q:計算機(jī)所目前在做哪些方面的工作?是高考機(jī)器人么?
趙東巖:這個項目實際上是為了檢驗自然語言處理現(xiàn)在研究的技術(shù)水平,在實際的高考這種基于文本的問答,就是以QA任務(wù)水平來設(shè)計的一個項目。
我們問題的輸入跟考生一樣就是一個紙的卷子,我們在后面要做基于文字的語言理解,讓機(jī)器來理解這個文字的語言,并且運用相應(yīng)領(lǐng)域知識,包括數(shù)學(xué)、語文、地理和歷史。我們這個課題組是偏重于地理這個試題的解答,運用這個知識,最后去生成相應(yīng)的答案,答案基本形式有選擇題和簡答題這兩種。也就是說一種是直接給ABCD,一種是生成文字,把你的答案再變成這個文字,這又涉及到計算機(jī)的生成語言來去解答。
人工智能是未來
Q:據(jù)了解,研究所跟南方都市報、今日頭條開展了合作,我想知道近期有沒有新的規(guī)劃?有沒有一些新的項目?
萬小軍:我們會推出一個語音采訪跟寫稿一體化的人工智能機(jī)器人,它會面對一個被采訪對象主動提問,用答復(fù)和基本的數(shù)據(jù)組成一個基本的稿件,未來兩三年會取代一些重復(fù)性、瑣碎的工作,使勞動力結(jié)構(gòu)朝著智能化趨勢發(fā)展,為社會發(fā)展做出更多貢獻(xiàn)。
Q:北大計算機(jī)所下一個35年的規(guī)劃能描述下嗎?
郭宗明:因為北大定了一個2035年的規(guī)劃:要躋身到世界一流大學(xué)前列,所以把我們2035年的遠(yuǎn)景跟大家做個分享。
1966年,計算機(jī)界人工智能的先驅(qū)MarvinMinsky(英)教授描繪了這樣一個場景:一個計算機(jī)連著一個攝像頭,攝像頭看著一臺電視,并能和電視旁邊的觀眾敘述電視里邊放什么內(nèi)容。他描繪的場景,我們今天沒完全實現(xiàn),但我們有理由相信這個完全可以實現(xiàn)。到2035年,計算機(jī)研究所就能實現(xiàn)MarvinMinsky(英)教授描繪的場景,而且會超過,我們的目標(biāo)是跨媒體語義理解和內(nèi)容生成。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。