123,123,123

本文作者：Azamat Abdoullaev

今天的人工智能 (AI) 是有限的。它還有很長的路要走。

一些AI研究人員發(fā)現(xiàn)，計算機通過反復試驗學習的機器學習算法已經(jīng)成為一種“神秘力量”。

不同類型的人工智能

人工智能 (AI) 的最新進展正在改善我們生活的許多方面。

人工智能分為三種類型：

狹義人工智能 (ANI)，具有狹窄的能力范圍。

通用人工智能 (AGI)，與人類能力相當。

人工超級智能 (ASI)，比人類更有智能。

今天的人工智能有什么問題？

今天的人工智能主要由統(tǒng)計學習模型和算法驅(qū)動，稱為數(shù)據(jù)分析、機器學習、人工神經(jīng)網(wǎng)絡或深度學習。它作為 IT 基礎設施（ML平臺、算法、數(shù)據(jù)、計算）和開發(fā)堆棧（從庫到語言、IDE、工作流和可視化）的組合來實現(xiàn)。

總之，其涉及：

一些應用數(shù)學、概率論和統(tǒng)計學

一些統(tǒng)計學習算法，邏輯回歸，線性回歸，決策樹和隨機森林

一些機器學習算法，有監(jiān)督、無監(jiān)督和強化

一些人工神經(jīng)網(wǎng)絡、深度學習算法和模型，通過多層過濾輸入數(shù)據(jù)以預測和分類信息

一些優(yōu)化（壓縮和量化）訓練的神經(jīng)網(wǎng)絡模型

一些統(tǒng)計模式和推論，例如高通神經(jīng)處理SDK，

一些編程語言，如 Python 和 R.

一些ML平臺、框架和運行時，例如PyTorch、ONNX、Apache MXNet、TensorFlow、Caffe2、CNTK、SciKit-Learn 和 Keras，

一些集成開發(fā)環(huán)境（IDE），如PyCharm、Microsoft VS Code、Jupyter、MATLAB等，

一些物理服務器、虛擬機、容器、專用硬件（如 GPU）、基于云的計算資源（包括虛擬機、容器和無服務器計算）。

當今使用的大多數(shù) AI 應用都可以歸類為狹義 AI，稱為弱 AI。

它們都缺少通用人工智能和機器學習，這由三個關(guān)鍵的交互引擎定義：

世界模型 [表示、學習和推理] 機，或現(xiàn)實模擬機（世界超圖網(wǎng)絡）。

世界知識引擎（全球知識圖譜）

世界數(shù)據(jù)引擎（全球數(shù)據(jù)圖網(wǎng)絡）

通用AI和ML和DL應用/機器/系統(tǒng)的區(qū)別在于將世界理解為多個似是而非的世界狀態(tài)表示，其現(xiàn)實機器和全球知識引擎以及世界數(shù)據(jù)引擎。

它是General/Real AI Stack 最重要的組成部分，與其真實世界的數(shù)據(jù)引擎交互，并提供智能功能/能力：

處理關(guān)于世界的信息

估計/計算/學習世界模型的狀態(tài)

概括其數(shù)據(jù)元素、點、集合

指定其數(shù)據(jù)結(jié)構(gòu)和類型

遷移其學習

將其內(nèi)容語境化

形成/發(fā)現(xiàn)因果數(shù)據(jù)模式，如因果規(guī)律、規(guī)則和規(guī)律

推斷所有可能的相互作用、原因、影響、循環(huán)、系統(tǒng)和網(wǎng)絡中的因果關(guān)系

以不同的范圍和規(guī)模以及不同的概括和規(guī)范水平預測/回顧世界的狀態(tài)

有效地和高效地與世界互動，適應它，導航它并根據(jù)它的智能預測和處方操縱它的環(huán)境

事實上，它主要是依靠大數(shù)據(jù)計算、算法創(chuàng)新以及統(tǒng)計學習理論和聯(lián)結(jié)主義哲學的統(tǒng)計歸納推理機。

對于大多數(shù)人來說，它只是構(gòu)建一個簡單的機器學習 (ML) 模型，經(jīng)歷數(shù)據(jù)收集、管理、探索、特征工程、模型訓練、評估，最后部署。

EDA：探索性數(shù)據(jù)分析

AI Ops — 管理 AI 的端到端生命周期

今天的人工智能的能力來自“機器學習”，需要針對每個不同的現(xiàn)實世界場景配置和調(diào)整算法。這使得它非常需要人工操作，并且需要花費大量時間來監(jiān)督其開發(fā)。這種手動過程也容易出錯、效率低下且難以管理。更不用說缺乏能夠配置和調(diào)整不同類型算法的專業(yè)知識。

配置、調(diào)整和模型選擇越來越自動化，谷歌、微軟、亞馬遜、IBM 等所有大型科技公司都推出了類似的AutoML平臺，使機器學習模型構(gòu)建過程自動化。

AutoML涉及自動化構(gòu)建基于機器學習算法的預測模型所需的任務。這些任務包括數(shù)據(jù)清理和預處理、特征工程、特征選擇、模型選擇和超參數(shù)調(diào)整，手動執(zhí)行這些任務可能很乏味。

SAS4485-2020.pdf

所呈現(xiàn)的端到端 ML 管道由 3 個關(guān)鍵階段組成，同時缺少所有數(shù)據(jù)的來源，即世界本身：

自動化機器學習——概述

Big-Tech AI 的關(guān)鍵秘密是作為暗深度神經(jīng)網(wǎng)絡的 Skin-Deep Machine Learning，它的模型需要通過大量標記數(shù)據(jù)和包含盡可能多的層的神經(jīng)網(wǎng)絡架構(gòu)進行訓練。

每個任務都需要其特殊的網(wǎng)絡架構(gòu)：

用于回歸和分類的人工神經(jīng)網(wǎng)絡 (ANN)用于計算機視覺的卷積神經(jīng)網(wǎng)絡 (CNN)用于時間序列分析的遞歸神經(jīng)網(wǎng)絡 (RNN)用于特征提取的自組織映射用于推薦系統(tǒng)的深度玻爾茲曼機推薦系統(tǒng)的自動編碼器

ANN作為一種信息處理范式被引入，似乎是受到生物神經(jīng)系統(tǒng)/大腦處理信息的方式的啟發(fā)。而這樣的人工神經(jīng)網(wǎng)絡被表示為“通用函數(shù)逼近器”，它可以學習/計算各種激活函數(shù)。

神經(jīng)網(wǎng)絡在測試階段通過特定的反向傳播和糾錯機制進行計算/學習。

試想一下，通過最小化錯誤，這些多層系統(tǒng)有望有一天自己學習和概念化想法。

人工神經(jīng)網(wǎng)絡 (ANN) 簡介

總而言之，幾行R或Python代碼就足以實現(xiàn)機器智能，并且有大量在線資源和教程可以訓練準神經(jīng)網(wǎng)絡，例如各種深度偽造網(wǎng)絡，操縱圖像-視頻-音頻-文本，對世界的了解為零，如生成對抗網(wǎng)絡、BigGAN、CycleGAN、StyleGAN、GauGAN、Artbreeder、DeOldify等。

他們創(chuàng)造和修改面孔、風景、通用圖像等，對它的全部內(nèi)容了解為零。

使用循環(huán)一致的對抗網(wǎng)絡進行不成對的圖像到圖像的轉(zhuǎn)換，使2019年成為新人工智能時代的 14 種深度學習和機器學習用途。

有無數(shù)的數(shù)字工具和框架以它們自己的方式運行：

開放語言——Python是最受歡迎的，R和 Scala也在其中。

開放框架——Scikit-learn、XGBoost、TensorFlow等。

方法和技術(shù)——從回歸到最先進的GAN和RL的經(jīng)典ML技術(shù)

提高生產(chǎn)力的能力——可視化建模、AutoAI 以幫助進行特征工程、算法選擇和超參數(shù)優(yōu)化

開發(fā)工具——DataRobot、H2O、Watson Studio、Azure ML Studio、Sagemaker、Anaconda 等。

令人遺憾的是，數(shù)據(jù)科學家的工作環(huán)境：scikit-learn、R、SparkML、Jupyter、R、Python、XGboost、Hadoop、Spark、TensorFlow、Keras、PyTorch、Docker、Plumbr 等等，不勝枚舉。

現(xiàn)代 AI 堆棧和 AI 即服務消費模型

構(gòu)建 AI 堆棧

冒充人工智能的，其實是虛假冒牌的人工智能。在最好的情況下，它是一種自動學習技術(shù)，ML/DL/NN 模式識別器，本質(zhì)上是數(shù)學和統(tǒng)計性質(zhì)的，無法憑直覺行事或?qū)ζ洵h(huán)境建模，具有零智能、零學習和零理解。

阻礙人工智能進步的問題

盡管有許多優(yōu)點，人工智能并不完美。以下是阻礙人工智能進步的 8 個問題以及根本錯誤所在：

1. 缺乏數(shù)據(jù)

人工智能需要大量數(shù)據(jù)集進行訓練，這些數(shù)據(jù)集應該具有包容性/公正性，并且質(zhì)量良好。有時他們必須等待生成新數(shù)據(jù)。

2. 耗時

人工智能需要足夠的時間讓算法學習和發(fā)展到足以以相當高的準確性和相關(guān)性實現(xiàn)其目的。它還需要大量資源才能發(fā)揮作用。這可能意味著對您的計算機能力有額外的要求。

3.結(jié)果解釋不力

另一個主要挑戰(zhàn)是準確解釋算法生成的結(jié)果的能力，還必須根據(jù)自己的目的仔細選擇算法。

4. 高度易錯

人工智能是自治的，但極易出錯。假設使用足夠小的數(shù)據(jù)集訓練算法，使其不具有包容性。最終會得到來自有偏見的訓練集的有偏見的預測。在機器學習的情況下，這樣的失誤會引發(fā)一系列錯誤，這些錯誤可能會在很長一段時間內(nèi)未被發(fā)現(xiàn)。當他們確實被注意到時，需要相當長的時間來識別問題的根源，甚至更長時間來糾正它。

5. 倫理問題

相信數(shù)據(jù)和算法勝過我們自己的判斷的想法有其優(yōu)點和缺點。顯然，我們從這些算法中受益，否則，我們一開始就不會使用它們。這些算法使我們能夠通過使用可用數(shù)據(jù)做出明智的判斷來自動化流程。然而，有時這意味著用算法取代某人的工作，這會帶來倫理后果。此外，如果出現(xiàn)問題，我們應該責怪誰？

6. 缺乏技術(shù)資源

人工智能還是比較新的技術(shù)。從啟動代碼到流程的維護和監(jiān)控，都需要機器學習專家來維護流程。人工智能和機器學習行業(yè)對市場來說仍然比較新鮮。以人力形式尋找足夠的資源也很困難。因此，缺乏可用于開發(fā)和管理機器學習科學物質(zhì)的有才華的代表。數(shù)據(jù)研究人員通常需要混合空間洞察力，以及從頭到尾的數(shù)學、技術(shù)和科學知識。

7.基礎設施不足

人工智能需要大量的數(shù)據(jù)處理能力。繼承框架無法處理壓力下的責任和約束。應該檢查基礎架構(gòu)是否可以處理人工智能中的問題.、如果不能，應該使用良好的硬件和適應性強的存儲來完全升級。

8.緩慢的結(jié)果和偏見

人工智能非常耗時。由于數(shù)據(jù)和要求過載，提供結(jié)果的時間比預期的要長。關(guān)注數(shù)據(jù)庫中的特定特征以概括結(jié)果在機器學習模型中很常見，這會導致偏差。

結(jié)論

人工智能已經(jīng)接管了我們生活的許多方面。雖然不完美，但人工智能是一個不斷發(fā)展的領域，需求量很大。在沒有人為干預的情況下，它使用已經(jīng)存在和處理過的數(shù)據(jù)提供實時結(jié)果。它通常通過開發(fā)數(shù)據(jù)驅(qū)動模型來幫助分析和評估大量數(shù)據(jù)。雖然人工智能有很多問題，這是一個不斷發(fā)展的領域。從醫(yī)學診斷、疫苗研發(fā)到先進的交易算法，人工智能已成為科學進步的關(guān)鍵。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

阻礙人工智能進步的8個問題

下一篇