決定AI應(yīng)用在智能手機(jī)上終端還是在云端運(yùn)行,對(duì)于用戶(hù)和開(kāi)發(fā)AI應(yīng)用的企業(yè)都十分重要,因?yàn)檫@與運(yùn)行設(shè)備的長(zhǎng)期電池壽命息息相關(guān)。大多數(shù)智能手機(jī)都或多或少地嵌入了AI應(yīng)用,但如果所有的AI工具都在終端運(yùn)行,有可能導(dǎo)致手機(jī)性能下降;而在云端運(yùn)行,則可能導(dǎo)致較長(zhǎng)的調(diào)用時(shí)間。
為了解決這一問(wèn)題,近日Facebook和亞利桑那州立大學(xué)建立了一個(gè)支持AI減輕設(shè)備負(fù)荷的模型——AutoScale。該模型能夠自動(dòng)決策部署AI運(yùn)行的位置,節(jié)省了大量成本,將AI工具的能效提高到基線(xiàn)方法的10.8倍;更能準(zhǔn)確預(yù)測(cè)AI應(yīng)用的合適位置,達(dá)到高性能和低能耗兼?zhèn)涞睦硐胄Ч?/p>
高能效+低負(fù)荷
AutoScale:挖掘強(qiáng)化學(xué)習(xí)算法的潛能
AutoScale會(huì)觀(guān)察當(dāng)前的AI工作執(zhí)行效率,包括算法的架構(gòu)特征和運(yùn)行時(shí)間差異。它在協(xié)同處理器等硬件之間選擇,找到能夠最大限度提高能源效率的硬件,以保證AI助手的服務(wù)質(zhì)量。對(duì)選定硬件定義的目標(biāo)執(zhí)行推理后,通過(guò)觀(guān)察其結(jié)果,包括演算運(yùn)行能耗、延遲度和推理精度,以表明選中的硬件是否提高了AI工作效率。
AutoScale模型
AutoScale基于強(qiáng)化學(xué)習(xí)算法,計(jì)算累計(jì)獎(jiǎng)勵(lì)(R值),來(lái)選擇AI工具的最佳運(yùn)行方式。例如:對(duì)于給定的處理器,系統(tǒng)使用基于AI能效利用率的模型計(jì)算獎(jiǎng)勵(lì),假設(shè)處理器內(nèi)核消耗的功率是可變的,內(nèi)核在繁忙和空閑狀態(tài)下花費(fèi)的處理時(shí)間不同,其能源使用情況也各不相同。相比之下,當(dāng)推理擴(kuò)展到連接的數(shù)據(jù)中心時(shí),AutoScale可以借助基于信號(hào)強(qiáng)度的模型來(lái)計(jì)算獎(jiǎng)勵(lì),預(yù)測(cè)傳輸延遲度和網(wǎng)絡(luò)消耗的能量。
在適應(yīng)QoS限制條約的前提下,比起基線(xiàn)模型,AutoScale更能提高能效。
12下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )