讓AI像自來水一樣簡單,華為云通用AI解決方案體驗(yàn)

前言

通用AI是一種能夠像人類一樣進(jìn)行思考、學(xué)習(xí)和推理的人工智能系統(tǒng)。與特定領(lǐng)域的人工智能不同,通用AI可以處理各種類型的任務(wù),包括自然語言處理、圖像識別、機(jī)器學(xué)習(xí)等,具有廣泛的適用性和高度的靈活性。

通用AI的應(yīng)用前景非常廣闊,它可以在醫(yī)療、交通、金融、教育、娛樂等各個(gè)領(lǐng)域發(fā)揮作用,為人類帶來更好的生活體驗(yàn)和更高效的工作方式。

通用AI的應(yīng)用場景

通用AI所涉及的應(yīng)用場景十分廣泛,由于它不需要人工進(jìn)行相關(guān)的訓(xùn)練,而且還可以從以往的經(jīng)驗(yàn)中不斷學(xué)習(xí)和改進(jìn),所以可以幫助加快許多行業(yè)的發(fā)展速度,并且在其中發(fā)揮著非比尋常的作用,通用AI在熱門行業(yè)領(lǐng)域中的應(yīng)用如下:

互聯(lián)網(wǎng)行業(yè)

1.       人證核身 IVS 可用于游戲/直播/婚戀交友平臺用戶實(shí)名認(rèn)證,響應(yīng)國家監(jiān)管要求,防止出現(xiàn)業(yè)務(wù)風(fēng)險(xiǎn)。

2.       內(nèi)容審核可用于涉黃、涉政暴恐、涉政敏感人物審核,監(jiān)控范圍覆蓋用戶昵稱、聊天圖片、音視頻,發(fā)布內(nèi)容等。

3.       語音交互 SIS 可用于游戲互動(dòng)場景,將語音轉(zhuǎn)成文字信息;或游戲配音時(shí),將腳本信息轉(zhuǎn)化為近似的真人發(fā)聲。

金融服務(wù)

1.        文字識別OCR可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的身份證、銀行卡、合同等的識別和驗(yàn)證。

2.        人證核身IVS和人臉識別FRS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)人臉識別、身份驗(yàn)證等場景,提高安全性和客戶體驗(yàn)。

3.        語音交互SIS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的語音客服、自助服務(wù)等場景,提高客戶體驗(yàn)和服務(wù)效率。

4.        對話機(jī)器人CBS可以幫助銀行、保險(xiǎn)等機(jī)構(gòu)處理客戶的咨詢、理賠等事項(xiàng)。

交通運(yùn)輸

1.        文字識別 OCR 可用于智慧停車、交通監(jiān)管的車牌識別場景。

2.        文字識別 OCR 和人證核身 IVS 可用于網(wǎng)絡(luò)貨運(yùn)/網(wǎng)約車/代駕的司機(jī)身份認(rèn)證場景,保障實(shí)際承運(yùn)人和注冊人保持一致。

3.        文字識別 OCR 可用于物流快遞的快遞分揀、包裹派件場景,自動(dòng)識別物流面單信息。

教育

1.        文字識別OCR可以用于學(xué)校的考試卷、試題、論文等的處理和評分。

2.        人證核身IVS和人臉識別FRS可以用于學(xué)校的考勤、門禁管理、預(yù)防考生代考等場景,提高學(xué)校管理效率和安全性。

3.        語音交互SIS可以用于學(xué)校的語音教育、智能評測等場景,提高教育效果和教育質(zhì)量。

4.        對話機(jī)器人CBS可以幫助學(xué)生進(jìn)行題目練習(xí)、知識點(diǎn)講解等。

電商零售

1.        文字識別OCR可以用于商場、超市的商品條碼、價(jià)格標(biāo)簽等的掃描和識別。

2.        人證核身IVS和人臉識別FRS可以用于商場、超市的人臉識別、客流分析等場景,提高營銷和客戶體驗(yàn)。

3.        對話機(jī)器人CBS可以幫助電商平臺、零售店鋪等提供智能客服服務(wù),提高售后服務(wù)質(zhì)量。

4.       內(nèi)容審核 Moderation 可用于稽核產(chǎn)品宣傳是否違反廣告法,是否違規(guī),防止出現(xiàn)業(yè)務(wù)風(fēng)險(xiǎn)。

華為云解決方案

華為云通用AI七件套定位為企業(yè)AI生產(chǎn)力工具,將算法專家的積累和行業(yè)專家的知識沉淀在相應(yīng)的套件和“行業(yè)工作流”(Workflow)中,幫助企業(yè)快速使用AI技術(shù),實(shí)現(xiàn)內(nèi)容的自動(dòng)化處理。

1.        文字識別 OCR:文字識別(Optical Character Recognition,簡稱 OCR)提供在線文字識別服務(wù),將圖片、掃描件或 PDF、OFD 文檔中的文字識別成可編輯的文本。支持通用類識別、證件類識別、票據(jù)類識別、行業(yè)類識別、自定義定制模板識別等。

2.        人臉識別服務(wù) FRS:人臉識別服務(wù)(Face Recognition Service),能夠在圖像中快速檢測人臉、分析人臉關(guān)鍵點(diǎn)信息、獲取人臉屬性、實(shí)現(xiàn)人臉的精確比對和檢索。該服務(wù)可應(yīng)用于身份驗(yàn)證、電子考勤、客流分析等場景。

3.        人證核身解決方案 IVS:將用戶本人與身份證信息關(guān)聯(lián)起來,應(yīng)用人臉識別與文字識別等技術(shù),對接權(quán)威數(shù)據(jù)庫,支持基于二要素(姓名、身份證)認(rèn)證或三要素(人臉、 姓名、身份證)認(rèn)證,實(shí)現(xiàn)對身份真實(shí)性的精準(zhǔn)核驗(yàn)。

4.        實(shí)時(shí)語音識別 RASR:實(shí)時(shí)語音識別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語音識別更快??蓱?yīng)用于直播實(shí)時(shí)字幕、會議實(shí)時(shí)記錄、即時(shí)文本生成等場景。

5.        圖像識別 Image :圖像識別(Image Recognition),基于深度學(xué)習(xí)技術(shù),可準(zhǔn)確識別圖像中的視覺內(nèi)容,提供多種物體、場景和概念標(biāo)簽,具備目標(biāo)檢測和屬性識別等能力,幫助客戶準(zhǔn)確識別和理解圖像內(nèi)容。

6.        內(nèi)容審核 Moderation:內(nèi)容審核(Content Moderation),基于圖像、文本、音頻、 視頻檢測技術(shù),可自動(dòng)進(jìn)行涉黃、廣告、涉暴等內(nèi)容檢測,幫助客戶降低業(yè)務(wù)違規(guī)風(fēng)險(xiǎn)。

7.        視頻編輯 VCP:視頻編輯(Video Content Processing)服務(wù),基于對視頻的整體分析,提供封面、拆條、摘要等能力。

通用AI服務(wù)以公有云服務(wù)為主,同時(shí)支持私有化部署,可選擇部署在本地服務(wù)器。華為云不僅提供 AI 原子能力,幫助客戶快速集成和應(yīng)用落地,同時(shí)也接受客戶定制化需求??蛻艨商峁┬枨笪臋n、交付時(shí)間和交付標(biāo)準(zhǔn),由華為云評估進(jìn)行定制開發(fā)。

解決方案核心亮點(diǎn)

超高性能

1.        識別率業(yè)界領(lǐng)先:語音交互服務(wù)基于深度學(xué)習(xí)技術(shù),對特定領(lǐng)域場景的語音識別進(jìn)行優(yōu)化,識別率達(dá)到業(yè)界領(lǐng)先。

2.        檢測范圍多場景覆蓋:圖像識別服務(wù)中圖片內(nèi)容審核覆蓋涉黃、低俗、廣告、涉政涉暴、涉政敏感人物和不良場景等多種違規(guī)風(fēng)險(xiǎn)的智能審核。

3.        定制化識別,效果更精準(zhǔn):實(shí)時(shí)語音識別針對客戶的特定場景需求,定制垂直領(lǐng)域的語音識別模型,識別效果更精確。

4.        實(shí)戰(zhàn)演練,穩(wěn)定可靠:內(nèi)容審核服務(wù)成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實(shí)踐,經(jīng)受過復(fù)雜場景考驗(yàn)。

簡單易用

1.        簡單上手,便捷高效:人臉識別服務(wù)提供的應(yīng)用程序接口功能明確。

2.        簡單易用:配套文檔描述詳細(xì),調(diào)用服務(wù)方式包含API和SDK兩種,方便客戶使用與集成。

3.        增值服務(wù)全套配齊:人證核身解決方案配套人臉識別 FRS、文字識別 OCR 等多種增值服務(wù)可供訂閱使用。

降本增效

1.        減少人力,節(jié)省成本:幫助客戶減少人力成本,節(jié)省業(yè)務(wù)支出。

2.        按需計(jì)費(fèi),經(jīng)濟(jì)劃算:以調(diào)用次數(shù)/調(diào)用時(shí)長計(jì)費(fèi)。

安全可信

1.        服務(wù)環(huán)境更安全:華為云承諾不保存服務(wù)過程數(shù)據(jù)和用戶隱私數(shù)據(jù) 。

2.        權(quán)威數(shù)據(jù)更可靠:人證核身解決方案服務(wù)數(shù)據(jù)來源自國家權(quán)威機(jī)構(gòu)公安第一研究所和全國身份證信息查詢中心。

3.        BSI 權(quán)威認(rèn)證更可信:華為云 OCR 服務(wù)通過德國 BSI AIC4 可信標(biāo)準(zhǔn)審計(jì)認(rèn)證。

華為云通用AI體驗(yàn)

華為云通用AI是華為云推出的一款人工智能服務(wù),它可以為企業(yè)提供豐富的AI能力,包括圖像識別、語音識別、自然語言處理等多種領(lǐng)域。華為云通用AI的目的是讓企業(yè)快速、便捷地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,提升業(yè)務(wù)效率和用戶體驗(yàn)。

下面結(jié)合應(yīng)用場景對文字識別OCR、人證核身IVS、人臉識別FRS、語音交互SIS、對話機(jī)器人CBS等產(chǎn)品進(jìn)行測評。

文字識別OCR

文字識別OCR可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的身份證、銀行卡、合同等的識別和驗(yàn)證;醫(yī)院的病歷、影像、處方等的識別和管理;學(xué)校的考試卷、試題、論文等的處理和評分;商場、超市的商品條碼、價(jià)格標(biāo)簽等的掃描和識別。

開通服務(wù)

這里我開通了智能分類識別、通用文字識別、車牌識別、身份證識別、發(fā)票驗(yàn)真、增值稅發(fā)票識別五個(gè)熱門服務(wù),調(diào)用服務(wù)有SDK和API兩種方式,下面以API調(diào)用身份證識別服務(wù)為例演示一遍。

產(chǎn)品體驗(yàn)

1.        首先下載Postman配置文件下載地址

2.        在API工具上導(dǎo)入配置文件





3.        Token認(rèn)證鑒權(quán)

4.        傳入?yún)?shù),這里傳入圖片的base64編碼,發(fā)送后會返回識別到的信息

產(chǎn)品優(yōu)勢

1.        識別準(zhǔn)確率高達(dá) 99.9%。采用先進(jìn)的自研深度學(xué)習(xí)算法,結(jié)合億萬級海量標(biāo)注數(shù)據(jù)樣本訓(xùn)練,針對各種業(yè)務(wù)場景優(yōu)化。

2.        推出業(yè)內(nèi)第一款智能分類超級 API,只需要調(diào)用 1 個(gè)API,即可同時(shí)識別各類票據(jù)、卡證類圖片,調(diào)用更簡單,且識別準(zhǔn)確率業(yè)內(nèi)領(lǐng)先。

3.        支持用戶自定義模板,對于版式固定的各種票據(jù)和卡證,均可通過可視化界面操作,指定需要識別的關(guān)鍵字段。識別準(zhǔn)確率和操作便捷性,均領(lǐng)先于友商。

人臉識別FRS

人臉識別FRS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)人臉識別、身份驗(yàn)證等場景,提高安全性和客戶體驗(yàn);醫(yī)院的門診、住院管理等場景,提高醫(yī)療服務(wù)效率和安全性;學(xué)校的考勤、門禁管理等場景,提高學(xué)校管理效率和安全性;商場、超市的人臉識別、客流分析等場景,提高營銷和客戶體驗(yàn)。

開通服務(wù)

華為云人臉識別服務(wù) FRS有以下四大功能。

1.        人臉檢測:可快速檢測圖像中是否有人臉,并返回所有人臉位置。

2.        人臉比對:對比兩張圖像中的人臉信息,分析面部特征,判斷是否為同一人。

3.        人臉?biāo)阉鳎核阉鲌D庫并返回與輸入人臉最相似的N張人臉圖像。

4.        活體檢測:提供兩種檢測方法,判斷圖片、視頻中人物是否為真人活體。

這里演示一遍調(diào)用人臉對比服務(wù)API,調(diào)用方法可參考用戶指南。

產(chǎn)品體驗(yàn)

傳入兩張照片,可以傳入base64編碼也可以直接傳入路徑或者選擇文件。發(fā)送后會返回照片的基本信息以及相似度,一般情況下超過0.93即可認(rèn)為是同一個(gè)人。



產(chǎn)品優(yōu)勢

1.        識別準(zhǔn)確:準(zhǔn)確檢測人臉,為多場景提供有力支撐,人臉比對在 LFW 公開測試集上的準(zhǔn)確率為 99.6%+。

2.        服務(wù)豐富:已開放人臉檢測、比對和搜索服務(wù),即將開放動(dòng)態(tài)人像、年齡識別、 特征點(diǎn)定位等服務(wù)。

3.        穩(wěn)定可靠:在海量圖片特征庫中進(jìn)行人臉?biāo)阉鞯裙δ芙?jīng)華為企業(yè)客戶的長期實(shí)踐,功能穩(wěn)定,時(shí)延可控。

4.        簡單高效:服務(wù)提供的應(yīng)用程序接口功能明確,簡單易用;配套文檔描述詳細(xì), 方便客戶使用與集成。

人證核身IVS

華為云人證核身IVS有以下兩個(gè)版本:

?         人證核身標(biāo)準(zhǔn)版(三要素):適用于通用的身份核驗(yàn)場景用戶上傳本人照片(可進(jìn)行活體檢測,確保由真人操作,抵御照片攻擊)和身份證照片,使用華為云文字識別服務(wù)識別證件內(nèi)容(如姓名、身份證號等),及人臉識別服務(wù)確認(rèn)操作者為證件主人,并對接公安部權(quán)威數(shù)據(jù)庫進(jìn)行實(shí)名認(rèn)證。

?         人證核身證件版(二要素):適用于僅需實(shí)名認(rèn)證身份證信息,無需人像識別的核驗(yàn)場景用戶上傳本人身份證照片,使用華為云文字識別服務(wù)識別證件內(nèi)容(如姓名、證件號等),并對接公安部權(quán)威數(shù)據(jù)庫進(jìn)行實(shí)名認(rèn)證。

兩個(gè)版本的本質(zhì)就是調(diào)用文字識別OCR和人臉識別FRS服務(wù)獲取信息,然后對接公安部權(quán)威數(shù)據(jù)庫進(jìn)行實(shí)名認(rèn)證。

開通服務(wù)

兩個(gè)版本調(diào)用API接口使用服務(wù)的流程一樣,這里以人證核身證件版(二要素)為例演示一遍,具體操作可參考用戶指南。

產(chǎn)品體驗(yàn)

傳入?yún)?shù),這里傳入圖片的base64編碼,發(fā)送后會返回識別到的信息。

 

產(chǎn)品優(yōu)勢

1.        權(quán)威可信:服務(wù)數(shù)據(jù)來源自國家權(quán)威機(jī)構(gòu)公安第一研究所和全國身份證信息查詢 中心。

2.        配套豐富:配套人臉識別 FRS、文字識別 OCR 等多種增值服務(wù)可供訂閱使用。

3.        超高性能:低延時(shí)、高吞吐、迅速響應(yīng)拓容需求。

4.        安全可信:華為云承諾不保存服務(wù)過程數(shù)據(jù)和用戶隱私數(shù)據(jù)。

語音交互SIS

語音交互SIS可以用于銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)的語音客服、自助服務(wù)等場景,提高客戶體驗(yàn)和服務(wù)效率;醫(yī)院的語音診斷、智能問診等場景,提高醫(yī)療服務(wù)效率和醫(yī)療質(zhì)量;學(xué)校的語音教育、智能評測等場景,提高教育效果和教育質(zhì)量。

開通服務(wù)

華為云語音交互SIS包含以下四種服務(wù):

1.        實(shí)時(shí)語音識別:將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語音識別更快。可應(yīng)用于直播實(shí)時(shí)字幕、會議實(shí)時(shí)記錄、即時(shí)文本生成等場景。

2.        一句話識別:一句話識別將口述音頻轉(zhuǎn)換為文本,通過API調(diào)用識別不超過一分鐘的不同音頻源發(fā)來的音頻流或音頻文件。適用于語音搜索、人機(jī)交互等語音交互識別場景。

3.        錄音文件識別:錄音文件識別,基于深度學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)5小時(shí)以內(nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。

4.        語音合成四種服務(wù):語音合成服務(wù)提供在線語音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語言多音色語音在線合成。支持客戶的個(gè)性化語音定制化需求。

產(chǎn)品體驗(yàn)

通過語音合成,實(shí)現(xiàn)高品質(zhì)的機(jī)器人發(fā)聲,使得人機(jī)交互更加自然。語音合成精品發(fā)音人,50個(gè)字符內(nèi)(含50個(gè))記為1次計(jì)費(fèi)調(diào)用;普通發(fā)音人,100個(gè)字符內(nèi)(含100個(gè))記為1次計(jì)費(fèi)調(diào)用。

產(chǎn)品優(yōu)勢

1.        識別準(zhǔn)確率高:采用最新一代語音識別技術(shù),基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural  Networks,簡稱 DNN)技術(shù),大大提高了抗噪性能,使識別準(zhǔn)確率顯著提升。

2.        識別速度快:把語言模型、詞典和聲學(xué)模型統(tǒng)一集成為一個(gè)大的神經(jīng)網(wǎng)絡(luò),同時(shí)在工程上進(jìn)行了大量的優(yōu)化,大幅提升解碼速度,使識別速度在業(yè)內(nèi)處于領(lǐng)先地位。

3.        多種識別模式:支持多種實(shí)時(shí)語音識別模式,如流式識別、連續(xù)識別和實(shí)時(shí)識別模式,靈活適應(yīng)不同應(yīng)用場景。

4.        定制化服務(wù):可定制特定垂直領(lǐng)域的語言層模型,可識別更多專有詞匯和行業(yè)術(shù)語,進(jìn)一步提高識別準(zhǔn)確率。

總結(jié)

通用AI的意義在于它可以應(yīng)用于各個(gè)行業(yè)領(lǐng)域,幫助人們更高效、更準(zhǔn)確地完成各種任務(wù)??梢酝ㄟ^自動(dòng)化、智能化等方式提高生產(chǎn)效率、降低成本、提高質(zhì)量、提高客戶滿意度等,從而推動(dòng)各個(gè)行業(yè)的發(fā)展。因此,通用AI的發(fā)展具有重要的戰(zhàn)略意義和經(jīng)濟(jì)價(jià)值。

當(dāng)下正值年中企業(yè)采購?fù)尽樵谀曛胁少徃叻甯梅?wù)企業(yè)客戶,華為云發(fā)起618營銷季,旨在讓廣大中小企業(yè)享受到更多優(yōu)質(zhì)產(chǎn)品、更大福利優(yōu)惠,一鍵省心上云,實(shí)現(xiàn)穩(wěn)定持續(xù)增長。

據(jù)悉,華為云618營銷季推出包含通用 AI 在內(nèi)的多款熱門產(chǎn)品及解決方案,即日起至6月30日,登錄華為云官網(wǎng)可享10000元禮包、福利抽獎(jiǎng)、 儲值返券、服務(wù)支持計(jì)劃等權(quán)益玩法,助力中小企業(yè)一鍵省心上云。感興趣的朋友盡快去看看吧!

文章來自:51CTO

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-06-28
讓AI像自來水一樣簡單,華為云通用AI解決方案體驗(yàn)
前言通用AI是一種能夠像人類一樣進(jìn)行思考、學(xué)習(xí)和推理的人工智能系統(tǒng)。與特定領(lǐng)域的人工智能不同,通用AI可以處理各種類型的任務(wù),包括自然語言處理、圖像識別、機(jī)器學(xué)習(xí)等,具有廣泛的適用性和高度的靈活性。通用AI的應(yīng)用前景非常廣闊,它可以在醫(yī)療、交通、金融、教育、娛樂等各個(gè)...

長按掃碼 閱讀全文