<style id="7i3y3"></style>

      <sub id="7i3y3"><i id="7i3y3"></i></sub>

        午夜精品一区二区三区成人,中文字幕av一区二区,亚洲AVAV天堂AV在线网阿V,肥臀浪妇太爽了快点再快点,国产网友愉拍精品视频手机,国产精品无码a∨麻豆,久久中文字幕一区二区,a级国产乱理伦片在线观看al
        中國(guó)自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
        新聞詳情

        Arm Ethos-U85 NPU:利用小語(yǔ)言模型在邊緣側(cè)實(shí)現(xiàn)生成式 AI

        http://www.kblhh.cn 2025-02-19 16:10 來(lái)源:Arm

        隨著人工智能 (AI) 的演進(jìn),利用小語(yǔ)言模型 (SLM) 在嵌入式設(shè)備上執(zhí)行 AI 工作負(fù)載成為業(yè)界關(guān)注的焦點(diǎn)。Llama、Gemma 和 Phi3 等小語(yǔ)言模型,憑借其出色的成本效益、高效率以及在算力受限設(shè)備上的易部署性,贏得了廣泛認(rèn)可。Arm 預(yù)計(jì)這類模型的數(shù)量將在 2025 年繼續(xù)增長(zhǎng)。

        Arm 技術(shù)以其高性能與低功耗的顯著優(yōu)勢(shì),為小語(yǔ)言模型提供了理想的運(yùn)行環(huán)境,能夠有效提升運(yùn)行效率,并進(jìn)一步優(yōu)化用戶體驗(yàn)。為了直觀展示端點(diǎn) AI 在物聯(lián)網(wǎng)和邊緣計(jì)算領(lǐng)域的巨大潛力,Arm技術(shù)團(tuán)隊(duì)近期打造了一場(chǎng)技術(shù)演示。在演示中,當(dāng)用戶輸入一個(gè)句子后,系統(tǒng)將基于該句擴(kuò)展生成一個(gè)兒童故事。這項(xiàng)演示受到了微軟 “Tiny Stories” 論文和 Andrej Karpathy 的 TinyLlama2 項(xiàng)目的啟發(fā),TinyLlama2 項(xiàng)目使用了 2,100 萬(wàn)個(gè)故事來(lái)訓(xùn)練小語(yǔ)言模型生成文本。

        該演示搭載了 Arm Ethos-U85 NPU,并在嵌入式硬件上運(yùn)行小語(yǔ)言模型。盡管大語(yǔ)言模型 (LLM) 更加廣為人知,但由于小語(yǔ)言模型能夠以更少的資源和較低的成本提供出色的性能,而且訓(xùn)練起來(lái)也更為簡(jiǎn)易且成本更低,因此越來(lái)越受到關(guān)注。

        在嵌入式硬件上實(shí)現(xiàn)基于 Transformer 的小語(yǔ)言模型

        Arm 的演示展示了 Ethos-U85 作為一個(gè)小型低功耗平臺(tái),具備運(yùn)行生成式 AI 的能力,并凸顯了小語(yǔ)言模型在特定領(lǐng)域中的出色表現(xiàn)。TinyLlama2 模型相較 Meta 等公司的大模型更為簡(jiǎn)化,很適合用于展示 Ethos-U85 的 AI 性能,可作為端點(diǎn) AI 工作負(fù)載的理想之選。

        為開發(fā)此演示,Arm 進(jìn)行了大量建模工作,包括創(chuàng)建一個(gè)全整數(shù)的 INT8(和 INT8x16)TinyLlama2 模型,并將其轉(zhuǎn)換為適合 Ethos-U85 限制的固定形狀 TensorFlow Lite 格式。

        Arm 的量化方法表明,全整數(shù)語(yǔ)言模型在取得高準(zhǔn)確度和輸出質(zhì)量之間實(shí)現(xiàn)了良好平衡。通過(guò)量化激活、歸一化函數(shù)和矩陣乘法,Arm 無(wú)需進(jìn)行浮點(diǎn)運(yùn)算。由于浮點(diǎn)運(yùn)算在芯片面積和能耗方面成本較高,這對(duì)于資源受限的嵌入式設(shè)備來(lái)說(shuō)是一個(gè)關(guān)鍵考量。

        Ethos-U85 在 FPGA 平臺(tái)上以 32 MHz 的頻率運(yùn)行語(yǔ)言模型,其文本生成速度可達(dá)到每秒 7.5 到 8 個(gè)詞元 (token),與人類的閱讀速度相當(dāng),同時(shí)僅消耗四分之一的計(jì)算資源。在實(shí)際應(yīng)用的系統(tǒng)級(jí)芯片 (SoC) 上,該性能最多可提高十倍,從而顯著提升了邊緣側(cè) AI 的處理速度和能效。

        兒童故事生成特性采用了 Llama2 的開源版本,并結(jié)合了 Ethos NPU 后端,在 TFLite Micro 上運(yùn)行演示。大部分推理邏輯以 C++ 語(yǔ)言在應(yīng)用層編寫,并通過(guò)優(yōu)化上下文窗口內(nèi)容,提高了故事的連貫性,確保 AI 能夠流暢地講述故事。

        由于硬件限制,團(tuán)隊(duì)需要對(duì) Llama2 模型進(jìn)行適配,以確保其在 Ethos-U85 NPU 上高效運(yùn)行,這要求對(duì)性能和準(zhǔn)確性進(jìn)行仔細(xì)考量。INT8 和 INT16 混合量化技術(shù)展示了全整數(shù)模型的潛力,這有利于 AI 社區(qū)更積極地針對(duì)邊緣側(cè)設(shè)備優(yōu)化生成式模型,并推動(dòng)神經(jīng)網(wǎng)絡(luò)在如 Ethos-U85 等高能效平臺(tái)上的廣泛應(yīng)用。

        Arm Ethos-U85 彰顯卓越性能

        Ethos-U85 的乘法累加 (MAC) 單元可以從 128 個(gè)擴(kuò)展至 2,048 個(gè),與前一代產(chǎn)品 Ethos-U65 相比,其能效提高了 20%。另外相較上一代產(chǎn)品,Ethos-U85 的一個(gè)顯著特點(diǎn)是能夠原生支持 Transformer 網(wǎng)絡(luò)。

        Ethos-U85 支持使用前代 Ethos-U NPU 的合作伙伴能夠?qū)崿F(xiàn)無(wú)縫遷移,并充分利用其在基于 Arm 架構(gòu)的機(jī)器學(xué)習(xí) (ML) 工具上的既有投資。憑借其卓越能效和出色性能,Ethos-U85 正愈發(fā)受到開發(fā)者青睞。

        如果在芯片上采用 2,048 個(gè) MAC 配置,Ethos-U85 可以實(shí)現(xiàn) 4 TOPS 的性能。在演示中,Arm 使用了較小的配置,即在 FPGA 平臺(tái)上采用 512 個(gè) MAC,并以 32 MHz 的頻率運(yùn)行具有 1,500 萬(wàn)個(gè)參數(shù)的 TinyLlama2 小語(yǔ)言模型。

        這一能力凸顯了將 AI 直接嵌入設(shè)備的可能性。盡管內(nèi)存有限(320 KB SRAM 用于緩存,32 MB 用于存儲(chǔ)),Ethos-U85 仍能高效處理此類工作負(fù)載,為小語(yǔ)言模型和其他 AI 應(yīng)用在深度嵌入式系統(tǒng)中的廣泛應(yīng)用奠定了基礎(chǔ)。

        將生成式 AI 引入嵌入式設(shè)備

        開發(fā)者需要更加先進(jìn)的工具來(lái)應(yīng)對(duì)邊緣側(cè) AI 的復(fù)雜性。Arm 通過(guò)推出 Ethos-U85,并支持基于 Transformer 的模型,致力于滿足這一需求。隨著邊緣側(cè) AI 在嵌入式應(yīng)用中的重要性日益增加,Ethos-U85 正在推動(dòng)從語(yǔ)言模型到高級(jí)視覺(jué)任務(wù)等各種新用例的實(shí)現(xiàn)。

        Ethos-U85 NPU 提供了創(chuàng)新前沿解決方案所需的卓越性能和出色能效。Arm 的演示顯示了將生成式 AI 引入嵌入式設(shè)備的重要進(jìn)展,并凸顯了在 Arm 平臺(tái)上部署小語(yǔ)言模型便捷可行。

        Arm 正為邊緣側(cè) AI 在廣泛應(yīng)用領(lǐng)域帶來(lái)新機(jī)遇,Ethos-U85 也因此成為推動(dòng)新一代智能、低功耗設(shè)備發(fā)展的關(guān)鍵動(dòng)力。

        版權(quán)所有 工控網(wǎng) Copyright?2025 Gkong.com, All Rights Reserved
        主站蜘蛛池模板: 国内精品久久久久影院日本| 少妇自慰流白口浆21p| 久久精品伊人狠狠大香网| 69天堂人成无码免费视频| yw尤物av无码国产在线观看| 亚洲日韩亚洲另类激情文学| 精品欧美一区二区三区久久久| av网站可以直接看的| 国产亚洲精品AA片在线播放天| 国产精品一区二区三区蜜臀| a男人的天堂久久a毛片| 色九月亚洲综合网| 最新国产精品剧情在线ss| 亚洲老妇女一区二区三区| 久久国产精品波多野结衣| 亚洲丶国产丶欧美一区二区三区| 欧美巨大极度另类| 人人妻碰人人免费| 成人免费乱码大片a毛片| 日韩人妻少妇一区二区三区 | 好深好爽办公室做视频| 伊人久久大香线蕉AV网禁呦| 香港特级三A毛片免费观看| 91超碰在线精品| 久久96热在精品国产高清| 成年午夜无码av片在线观看| 亚洲人成网站18禁止无码| 我趁老师睡觉摸她奶脱她内裤| 国产午夜精品无码一区二区| 91香蕉国产亚洲一二三区| 免费观看男人免费桶女人视频| 国产精品午夜福利视频| 91久久国产成人免费观看| 亚洲国产成人va在线观看天堂| 亚洲一区二区三区| 国产在线码观看超清无码视频| 久久精品国产99国产精品澳门 | 亚洲av第一区二区三区| 无码熟妇人妻av在线电影| 国产一区二区三区四区色| 成人又黄又爽又色的视频|