特级AAAAAAAAA毛片免费,亚洲永久无码3D动漫一区

本文作者：Sally Ward-Foxton

計算機(jī)視覺是否會再次自我改造？

匹茲堡大學(xué)眼科教授、CMU 機(jī)器人研究所兼職教授 Ryad Benosman 認(rèn)為確實(shí)如此。作為基于事件的視覺技術(shù)的創(chuàng)始人之一，Benosman 預(yù)計神經(jīng)形態(tài)視覺——基于基于事件的相機(jī)的計算機(jī)視覺——將成為計算機(jī)視覺的下一個方向。

“計算機(jī)視覺已經(jīng)被重新發(fā)明了很多很多次，”Benosman說?！拔乙呀?jīng)看到它至少重新發(fā)明了兩次?！?/p>

Benosman 提到了 1990 年代從帶有一點(diǎn)攝影測量的圖像處理到基于幾何的方法的轉(zhuǎn)變，然后是今天機(jī)器學(xué)習(xí)的快速發(fā)展。盡管發(fā)生了這些變化，現(xiàn)代計算機(jī)視覺技術(shù)仍然主要基于圖像傳感器——產(chǎn)生類似于人眼所見圖像的相機(jī)。

根據(jù) Benosman 的說法，在圖像傳感范式不再有用之前，它會阻礙替代技術(shù)的創(chuàng)新。高性能處理器（例如 GPU）的發(fā)展推遲了尋找替代解決方案的需要，因此延長了這種影響。

“我們?yōu)槭裁磳D像用于計算機(jī)視覺？這是一個價值百萬美元的問題，”他說?！拔覀儧]有理由使用圖像——這只是因?yàn)闅v史的動力。甚至在沒有相機(jī)之前，圖像就有動力?！?/p>圖像相機(jī)

自從公元前五世紀(jì)針孔相機(jī)出現(xiàn)以來，圖像相機(jī)就一直存在到 1500 年代，藝術(shù)家們使用房間大小的設(shè)備將房間外的人或風(fēng)景的圖像追蹤到畫布上。多年來，這些畫被替換為膠片來記錄圖像。數(shù)碼攝影等創(chuàng)新最終使圖像相機(jī)很容易成為現(xiàn)代計算機(jī)視覺技術(shù)的基礎(chǔ)。

然而，Benosman 認(rèn)為，基于圖像相機(jī)的計算機(jī)視覺技術(shù)效率極低。他的比喻是中世紀(jì)城堡的防御系統(tǒng)：位于城墻周圍的衛(wèi)兵四處尋找接近的敵人。鼓手穩(wěn)定地敲打，每一個鼓點(diǎn)，每個守衛(wèi)都會大聲喊出他們所看到的。在一片喧嘩中，聽到一個守衛(wèi)在遙遠(yuǎn)的森林邊緣發(fā)現(xiàn)敵人是多么容易？

21 世紀(jì)的鼓點(diǎn)硬件等價物是電子時鐘信號，而守衛(wèi)是像素。大量數(shù)據(jù)被創(chuàng)建并且必須在每個時鐘周期進(jìn)行檢查，這會導(dǎo)致大量冗余信息，從而需要大量不必要的計算。

“人們正在燃燒如此多的能量，它占用了城堡的整個計算能力來保護(hù)自己，”Benosman說。如果發(fā)現(xiàn)了一個有趣的事件——在這個類比中以敵人為代表——“你必須四處走動收集無用的信息，人們到處尖叫，所以帶寬很大……現(xiàn)在想象你有一座復(fù)雜的城堡。所有這些人都必須被聽到?！?/p>

進(jìn)入神經(jīng)形態(tài)視覺?；舅枷胧艿缴锵到y(tǒng)工作方式的啟發(fā)，即檢測場景動態(tài)的變化，而不是連續(xù)分析整個場景。在我們的城堡類比中，這意味著讓守衛(wèi)保持安靜，直到他們看到感興趣的東西，然后喊出他們的位置以發(fā)出警報。在電子版中，這意味著讓單個像素確定他們是否看到相關(guān)的東西。

“像素可以自行決定他們應(yīng)該發(fā)送什么信息，”Benosman說。

“他們可以尋找有意義的信息——特征，而不是獲取系統(tǒng)信息。這就是與眾不同的地方?！?/p>

Prophesee 與索尼合作開發(fā)的 DVS 傳感器評估套件。Benosman 是 Prophesee 的聯(lián)合創(chuàng)始人。（來源：Prophesee）

與固定頻率的系統(tǒng)采集相比，這種基于事件的方法可以節(jié)省大量功率并減少延遲。

“你想要一些更具適應(yīng)性的東西，這就是[基于事件的視覺]的相對變化給你的東西——適應(yīng)性采集頻率，”他說?！爱?dāng)你觀察幅度變化時，如果某些東西移動得非?？?，我們就會得到很多樣本。如果某些東西沒有改變，你會得到幾乎為零，所以你正在根據(jù)場景的動態(tài)調(diào)整你的采集頻率。這就是它帶來的東西。這就是為什么它是一個好的設(shè)計。”

Benosman 于 2000 年進(jìn)入神經(jīng)形態(tài)視覺領(lǐng)域，他堅信先進(jìn)的計算機(jī)視覺永遠(yuǎn)無法發(fā)揮作用，因?yàn)閳D像不是正確的方法。

“最大的轉(zhuǎn)變是說我們可以在沒有灰度和沒有圖像的情況下進(jìn)行視覺，這在 2000 年底是異端——完全是異端，”他說。

Benosman 提出的技術(shù)——今天基于事件的傳感的基礎(chǔ)——是如此不同，以至于提交給當(dāng)時最重要的 IEEE 計算機(jī)視覺期刊的論文在未經(jīng)審查的情況下被拒絕。事實(shí)上，直到 2008 年動態(tài)視覺傳感器 (DVS) 的開發(fā)，該技術(shù)才開始獲得動力。

神經(jīng)科學(xué)靈感

神經(jīng)形態(tài)技術(shù)是受生物系統(tǒng)啟發(fā)的技術(shù)，包括終極計算機(jī)：大腦及其神經(jīng)元，或計算元素。問題是沒有人完全理解神經(jīng)元是如何工作的。雖然我們知道神經(jīng)元對傳入的稱為尖峰的電信號起作用，但直到最近，研究人員仍將神經(jīng)元描述為相當(dāng)草率，認(rèn)為只有尖峰的數(shù)量很重要。這個假設(shè)持續(xù)了幾十年，但最近的工作證明，這些尖峰的時間是絕對關(guān)鍵的，并且大腦的結(jié)構(gòu)會在這些尖峰中產(chǎn)生延遲來編碼信息。

今天的尖峰神經(jīng)網(wǎng)絡(luò)模擬大腦中看到的尖峰信號，是真實(shí)事物的簡化版本——通常是尖峰的二進(jìn)制表示?！拔沂盏揭粋€ 1，我醒來，我計算，我睡覺，”Benosman 解釋說?，F(xiàn)實(shí)要復(fù)雜得多。當(dāng)尖峰到來時，神經(jīng)元開始隨著時間的推移對尖峰的值進(jìn)行積分；神經(jīng)元也有泄漏，這意味著結(jié)果是動態(tài)的。此外，大約有 50 種不同類型的神經(jīng)元具有 50 種不同的集成配置文件。

當(dāng)前的電子版本缺少集成的動態(tài)路徑、神經(jīng)元之間的連接性以及不同的權(quán)重和延遲。“問題在于，要制造出有效的產(chǎn)品，你不能[模仿]所有的復(fù)雜性，因?yàn)槲覀儾焕斫馑彼f。“如果我們有好的大腦理論，我們就會解決它。問題是，我們只是不知道。”

Bensoman 經(jīng)營著一個獨(dú)特的實(shí)驗(yàn)室，致力于了解皮層計算背后的數(shù)學(xué)原理，旨在創(chuàng)建新的數(shù)學(xué)模型并將其復(fù)制為硅設(shè)備。這包括直接監(jiān)測來自真實(shí)視網(wǎng)膜的尖峰。

目前，Bensoman反對忠實(shí)地復(fù)制生物神經(jīng)元，稱這種方法是過時的。

“在硅中復(fù)制神經(jīng)元的想法的產(chǎn)生是因?yàn)槿藗冇^察了晶體管并看到了一個看起來像真正神經(jīng)元的機(jī)制，所以一開始它背后有一些想法，”他說。“我們沒有細(xì)胞；我們有硅。你需要適應(yīng)你的計算基板，而不是相反……如果我知道我在計算什么并且我有芯片，我可以優(yōu)化這個方程式并以最低的成本、最低的功耗、最低的延遲運(yùn)行它?！?/p>處理能力

無需精確復(fù)制神經(jīng)元這一認(rèn)識以及 DVS 相機(jī)的發(fā)展是當(dāng)今視覺系統(tǒng)背后的驅(qū)動力。雖然系統(tǒng)已經(jīng)上市，但在完全類似于人類的視覺可用于商業(yè)用途之前，還需要取得進(jìn)展。

Benosman 說，最初的 DVS 相機(jī)具有“大而粗的像素”，因?yàn)楣怆姸O管本身周圍的組件大大降低了填充因子。雖然對開發(fā)這些攝像機(jī)的投資加速了這項(xiàng)技術(shù)，但貝諾斯曼明確表示，今天的事件攝像機(jī)只是對早在 2000 年開發(fā)的原始研究設(shè)備的改進(jìn)。索尼最先進(jìn)的 DVS 攝像機(jī)，三星和 Omnivision 擁有微小的像素，融合了 3D 堆疊等先進(jìn)技術(shù)并降低了噪點(diǎn)。Benosman 擔(dān)心的是今天使用的傳感器類型能否成功擴(kuò)大規(guī)模。

“問題是，一旦你增加像素數(shù)量，你就會得到大量數(shù)據(jù)，因?yàn)槟愕乃俣热匀环浅？?，”他說。“你可能仍然可以實(shí)時處理它，但是你會從太多的像素中得到太多的相對變化。這現(xiàn)在正在殺死所有人，因?yàn)樗麄兛吹搅藵摿?，但他們沒有合適的處理器來支持它?！?/p>

這個 Prophesee 客戶應(yīng)用示例顯示了圖像攝像頭（每個框的左上角）和 DVS 傳感器輸出之間的差異。（來源：Prophesee）

通用神經(jīng)形態(tài)處理器落后于 DVS 相機(jī)對應(yīng)物。一些業(yè)內(nèi)最大的參與者（IBM Truenorth、英特爾 Loihi）的努力仍在進(jìn)行中。Benosman 表示，正確的處理器和正確的傳感器將是無與倫比的組合。

“[今天的 DVS] 傳感器速度極快，帶寬超低，動態(tài)范圍大，因此您可以在室內(nèi)和室外看到，”Benosman 說?！斑@是未來。它會起飛嗎？絕對地?！?/p>

“誰能把處理器放在那里并提供完整的堆棧，誰就贏了，因?yàn)樗鼘⑹菬o與倫比的，”他補(bǔ)充道。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

計算機(jī)視覺技術(shù)即將迎來重大轉(zhuǎn)變

下一篇