<style id="7i3y3"></style>

      <sub id="7i3y3"><i id="7i3y3"></i></sub>

        午夜精品一区二区三区成人,中文字幕av一区二区,亚洲AVAV天堂AV在线网阿V,肥臀浪妇太爽了快点再快点,国产网友愉拍精品视频手机,国产精品无码a∨麻豆,久久中文字幕一区二区,a级国产乱理伦片在线观看al
        中國自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
        新聞詳情

        國內(nèi)首個(gè)國產(chǎn)AI推理千卡集群落地湛江

        http://www.kblhh.cn 2026-03-12 15:40 來源:21世紀(jì)經(jīng)濟(jì)報(bào)道

        3 月 12 日,云天勵(lì)飛中標(biāo)湛江市AI滲透支撐新質(zhì)生產(chǎn)力基礎(chǔ)設(shè)施建設(shè)項(xiàng)目,中標(biāo)金額4.2億元。項(xiàng)目將基于云天勵(lì)飛自研的國產(chǎn)AI推理加速卡,建設(shè)國產(chǎn)AI推理千卡集群。

        該集群將搭載DeepSeek等國產(chǎn)大模型,為政務(wù)、產(chǎn)業(yè)及各類應(yīng)用場(chǎng)景提供更加便捷、低成本的AI能力,探索打造“國模國芯”的AI生態(tài)樣板。

        AI算力轉(zhuǎn)向“推理優(yōu)先”

        智算集群是人工智能時(shí)代的基礎(chǔ)設(shè)施。如果說電力支撐了工業(yè)時(shí)代,互聯(lián)網(wǎng)支撐了信息時(shí)代,那么智算正在成為支撐AI時(shí)代的重要底座。

        在AI算力體系中,算力大體可以分為訓(xùn)練算力與推理算力。訓(xùn)練算力決定模型如何完成“從0到1”的能力構(gòu)建,而推理算力則直接支撐AI應(yīng)用落地。

        無論是春節(jié)期間大熱的SeeDance,近期廣泛討論的“小龍蝦”,還是各行業(yè)不斷上線的AI Agent應(yīng)用,背后都離不開推理算力的支撐。根據(jù)Gartner預(yù)測(cè),到2026年,約55%的AI專用云基礎(chǔ)設(shè)施支出將用于推理工作負(fù)載。

        過去,國內(nèi)許多智算中心普遍采用“訓(xùn)推一體”的建設(shè)模式。而此次在湛江建設(shè)的集群,則定位為專注推理任務(wù)的AI推理集群,主要面向各類行業(yè)應(yīng)用場(chǎng)景,為傳統(tǒng)產(chǎn)業(yè)的AI化提供直接支撐。

        湛江也是國產(chǎn)大模型DeepSeek創(chuàng)始人梁文峰的家鄉(xiāng)。近年來,當(dāng)?shù)卦?ldquo;DeepSeek+”應(yīng)用探索方面動(dòng)作頻頻。2025年初,DeepSeek-R1發(fā)布后,湛江即完成本地部署,基于國產(chǎn)技術(shù)棧的DeepSeek-R1大模型率先在湛江政務(wù)云上線。該模型在處理通用政務(wù)事務(wù)的同時(shí),還能夠持續(xù)學(xué)習(xí)本地產(chǎn)業(yè)知識(shí)與方言表達(dá),逐漸形成具有地方特色的“湛江智慧”。

        此次云天勵(lì)飛建設(shè)的AI推理集群,也將與DeepSeek等國產(chǎn)模型進(jìn)行適配,為更多行業(yè)應(yīng)用提供算力支撐。

        面向推理時(shí)代的千卡集群架構(gòu)

        在大模型應(yīng)用場(chǎng)景中,推理系統(tǒng)通常需要同時(shí)滿足高并發(fā)、高吞吐與低延遲三項(xiàng)要求。為提升整體效率,當(dāng)前業(yè)界普遍采用“Prefill–Decode分離”的推理架構(gòu),通過對(duì)不同階段進(jìn)行資源優(yōu)化,實(shí)現(xiàn)系統(tǒng)性能的整體提升。

        其中,Prefill階段主要負(fù)責(zé)對(duì)長上下文進(jìn)行理解和計(jì)算,計(jì)算量大、帶寬需求高;而Decode階段則負(fù)責(zé)持續(xù)生成Token,對(duì)系統(tǒng)延遲更加敏感。如何在兩個(gè)階段之間進(jìn)行合理的資源配置,成為推理系統(tǒng)架構(gòu)設(shè)計(jì)的重要問題。

        與此同時(shí),隨著大模型上下文長度不斷增加,大量中間狀態(tài)需要以KV Cache的形式存儲(chǔ)。業(yè)內(nèi)普遍認(rèn)為,未來推理系統(tǒng)的性能瓶頸將越來越多來自數(shù)據(jù)訪問效率,而不僅僅是計(jì)算能力。

        在這一背景下,算力、存儲(chǔ)與網(wǎng)絡(luò)之間的協(xié)同設(shè)計(jì),正逐漸成為AI基礎(chǔ)設(shè)施的重要競(jìng)爭(zhēng)力。

        此次在湛江落地的千卡推理集群,正是圍繞這一思路進(jìn)行構(gòu)建。

        該集群采用云天勵(lì)飛自主研發(fā)的AI推理芯片,并在系統(tǒng)架構(gòu)上確立了“優(yōu)先優(yōu)化Prefill、兼顧Decode”的技術(shù)路線。通過在芯片設(shè)計(jì)中對(duì)計(jì)算資源與存儲(chǔ)帶寬進(jìn)行針對(duì)性配置,使系統(tǒng)在長上下文推理場(chǎng)景下依然能夠保持較高的吞吐效率。

        在網(wǎng)絡(luò)互聯(lián)方面,系統(tǒng)采用統(tǒng)一高速互聯(lián)架構(gòu),通過400G光網(wǎng)絡(luò)構(gòu)建集群物理層網(wǎng)絡(luò),實(shí)現(xiàn)節(jié)點(diǎn)之間的高帶寬、低延遲通信。與傳統(tǒng)在節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間分別采用不同協(xié)議構(gòu)建網(wǎng)絡(luò)的方式相比,這種同構(gòu)互聯(lián)架構(gòu)減少了協(xié)議轉(zhuǎn)換帶來的額外開銷,也簡化了系統(tǒng)部署。

        在部署能力上,該架構(gòu)既可以支持單節(jié)點(diǎn)數(shù)十卡規(guī)模擴(kuò)展,也能夠平滑擴(kuò)展至千卡級(jí)集群規(guī)模,從而適配不同規(guī)模的AI應(yīng)用需求。

        此外,針對(duì)大模型推理中KV Cache訪問帶來的壓力,系統(tǒng)在計(jì)算互聯(lián)與存儲(chǔ)互聯(lián)層面進(jìn)行了協(xié)同優(yōu)化。通過計(jì)算網(wǎng)絡(luò)與存儲(chǔ)網(wǎng)絡(luò)的聯(lián)合調(diào)度,可以顯著提升數(shù)據(jù)讀取效率,使模型在長上下文推理場(chǎng)景下依然保持穩(wěn)定性能。

        通過芯片架構(gòu)、網(wǎng)絡(luò)互聯(lián)以及系統(tǒng)調(diào)度等多層優(yōu)化,這一推理集群在整體效率與成本控制方面形成了明顯優(yōu)勢(shì),為AI規(guī)模化應(yīng)用提供了更加經(jīng)濟(jì)的算力方案。

        低成本提供穩(wěn)定的大規(guī)模推理能力

        記者從云天勵(lì)飛了解到,本次AI推理集群將分三期建設(shè),并全部采用自研的國產(chǎn)AI推理加速卡。

        其中,一期項(xiàng)目將部署云天勵(lì)飛 X6000 推理加速卡;二、三期建設(shè)將率先搭載公司最新一代芯片產(chǎn)品。

        根據(jù)公司規(guī)劃,未來三年云天勵(lì)飛將推出三代AI推理芯片產(chǎn)品。

        第一階段,將推出面向長上下文場(chǎng)景優(yōu)化的Prefill芯片,通過提升計(jì)算效率與內(nèi)存訪問能力,為OpenClaw、各類AI Agent提供基礎(chǔ)算力支撐。

        第二階段,將研發(fā)專注于Decode階段低延遲優(yōu)化的芯片產(chǎn)品,進(jìn)一步提升實(shí)時(shí)推理能力。

        第三階段,則通過系統(tǒng)級(jí)協(xié)同優(yōu)化,實(shí)現(xiàn)Prefill與Decode性能的整體提升,向毫秒級(jí)推理時(shí)延目標(biāo)邁進(jìn)。

        其中,首款Prefill芯片DeepVerse100預(yù)計(jì)將在年內(nèi)完成流片,并計(jì)劃在湛江集群中率先部署。

        在更長期的規(guī)劃中,云天勵(lì)飛提出“1001計(jì)劃”,即以“百億Token一分錢”為長期目標(biāo),通過芯片與系統(tǒng)協(xié)同優(yōu)化持續(xù)降低大模型推理成本。

        過去幾年,AI算力建設(shè)往往以“堆算力”為主要路徑,通過不斷擴(kuò)大GPU規(guī)模來獲得更高性能。但隨著大模型逐漸進(jìn)入應(yīng)用階段,產(chǎn)業(yè)關(guān)注點(diǎn)正從“算力峰值”轉(zhuǎn)向“單位成本效率”。

        換句話說,未來AI產(chǎn)業(yè)競(jìng)爭(zhēng)的重要維度,不僅在于模型能力本身,還在于誰能夠以更低成本提供穩(wěn)定的大規(guī)模推理能力。

        湛江項(xiàng)目的落地,也為這一目標(biāo)提供了重要的實(shí)踐場(chǎng)景。千卡級(jí)推理集群不僅能夠滿足當(dāng)前AI應(yīng)用需求,同時(shí)也為更大規(guī)模算力系統(tǒng)提供技術(shù)部署平臺(tái)。

        在典型架構(gòu)下,一個(gè)千卡級(jí)集群通常由多級(jí)擴(kuò)展結(jié)構(gòu)組成:從單節(jié)點(diǎn)8卡、32卡,到64卡甚至百卡級(jí)超節(jié)點(diǎn),再到跨節(jié)點(diǎn)的大規(guī)模集群。

        通過這一規(guī)模系統(tǒng)的實(shí)際運(yùn)行,可以充分驗(yàn)證卡間互聯(lián)、節(jié)點(diǎn)通信和負(fù)載均衡等關(guān)鍵技術(shù),為未來更大規(guī)模AI算力系統(tǒng)建設(shè)積累經(jīng)驗(yàn)。

        隨著大模型逐步進(jìn)入產(chǎn)業(yè)應(yīng)用階段,AI基礎(chǔ)設(shè)施的發(fā)展邏輯也正在發(fā)生變化——從單純追求算力規(guī)模,轉(zhuǎn)向更加注重效率與成本。

        在業(yè)內(nèi)看來,推理算力將成為決定AI應(yīng)用規(guī)模化落地的關(guān)鍵基礎(chǔ)設(shè)施。誰能夠以更高效率、更低成本提供穩(wěn)定的大規(guī)模推理能力,誰就有機(jī)會(huì)在新一輪人工智能產(chǎn)業(yè)競(jìng)爭(zhēng)中占據(jù)先機(jī)。

        此次湛江AI推理千卡集群的建設(shè),為當(dāng)?shù)禺a(chǎn)業(yè)數(shù)字化轉(zhuǎn)型提供了重要算力底座,國產(chǎn)模型與國產(chǎn)芯片協(xié)同發(fā)展有了實(shí)踐場(chǎng)景。AI基礎(chǔ)設(shè)施正逐步從技術(shù)探索走向規(guī)模化應(yīng)用,為人工智能產(chǎn)業(yè)的下一階段發(fā)展打開新的空間。

        版權(quán)所有 工控網(wǎng) Copyright?2026 Gkong.com, All Rights Reserved
        主站蜘蛛池模板: 图片区小说区av区| 久久久这里只有精品10| 熟妇人妻系列aⅴ无码专区友真希| 男人进女人下部全黄大色视频| 精品国产高清中文字幕| 亚洲精品中文av在线| 婷婷色香五月综合缴缴情香蕉| 国产精品美女久久久久久麻豆| 无码熟妇人妻AV影音先锋| 亚洲va成无码人在线观看天堂| 久久国产免费观看精品| 久久不见久久见免费视频观看| 久久天天躁夜夜躁一区| 午夜爽爽爽男女免费观看影院| 少妇久久久被弄到高潮| 五月色丁香婷婷网蜜臀av| 欧美日韩一区二区三区在线视频 | 亚洲不卡av不卡一区二区| 一区二区三区国产亚洲网站| 最近中文字幕完整版2019| 亚洲精品国产美女久久久| 中文字幕久久波多野结衣av| 国产一区二区三区九九视频| 中文字幕人妻中出制服诱惑| 日韩av片无码一区二区不卡| 久99久热只有精品国产99| 色就色中文字幕在线视频| 国产精品久久一区二区三区| 蜜桃在线免费观看网站| 熟妇人妻无码xxx视频| 少妇被粗大的猛烈进出69影院一| 妺妺窝人体色WWW看美女| AV人摸人人人澡人人超碰| 波多野结衣久久一区二区| 久久96热人妻偷产精品| 日韩一区二区三在线观看| 深夜精品免费在线观看| 2021国产精品视频网站| 91香蕉国产亚洲一二三区| 国产情精品嫩草影院88av| 年轻漂亮的人妻被公侵犯bd免费版|