近日,存算一體AI芯片公司——微納核芯完成B3輪和B4輪,合計超10億元的融資。
兩輪融資聚集中國移動鏈長基金、超越摩爾、江城基金、佰維存儲、知名大模型公司等產業投資方,中國互聯網投資基金等國家級戰略投資平臺,中芯聚源、毅達資本、藍馳創投、東方嘉富及立訊精密產投等老股東繼續加持。
中國移動鏈長基金相關負責人認為,中國移動鏈長基金高度看好AI推理芯片的市場前景。微納核芯的三維存算一體技術能夠實現大模型推理的高性能、低功耗、低成本。未來,中國移動將依托海量手機終端生態與移動云算力資源優勢,攜手公司,在手機端AI算力及智能終端領域推進相關應用的落地,深化產投協同。
佰維存儲表示,微納核芯全球首創的3D-CIM?技術,將3D近存、存內計算與RISC-V指令集深度融合,用成熟工藝實現了先進工藝的性能與能效,真正破解了行業“高性能 + 低功耗 + 低成本”的不可能三角。佰維存儲將與公司持續開展產業合作,助力公司成為全球端側AI芯片的領軍企業。
據了解,伴隨大模型的快速普及,AI產業正逐步從“訓練驅動”轉向“推理驅動”。相對于訓練,推理需要持續承載海量請求,而且智能體、多模態、實時交互等新應用形態也在顯著提升AI推理需求與系統負載。在此背景下,行業開始從“集中式云推理”逐步演進到“端-邊-云協同推理”架構。相比純云側推理模式,端側推理在實時響應、隱私保護、離線能力與系統成本等方面具備天然優勢,推動大模型推理逐步向終端設備遷移。蘋果和OpenAI等廠商都會陸續推出支持本地大模型推理的新一代AI終端。
與此同時,大模型推理催生AI芯片架構重構,谷歌DeepMind團隊的圖靈獎得主David Patterson近期研究指出,當前GPU/TPU等主流架構在大模型推理場景下面臨顯著的內存帶寬與延遲瓶頸,產業正加速探索“算力靠近存儲”等新型AI計算架構。尤其在手機場景下,大模型推理需要在極低功耗與有限面積條件下持續運行,對算力密度、計算能效和數據帶寬提出了更高要求。
微納核芯全球首創3D-CIM?架構 (3D近存+存內計算+RISC-V存算),從根本上消除數據搬運開銷,在成熟工藝上突破數據帶寬、算力密度和計算能效瓶頸。
據悉,隨著B3輪融資到位,公司兩款核心產品線進入產品化關鍵階段:PCIe-CIM?系列:面向AI手機、AI PC、云側智算中心、一體機的大模型推理協處理器,已完成核心研發與仿真驗證;LP-CIM?系列:全球領先的近存+存算解決方案,與存儲原廠深度協同為端側AI提供極致能效比方案,產品化進程穩步推進。
目前,公司端側AI芯片正逐步進入產品周期。公司于2025年與主流手機客戶敲定配套主芯片型號并完成軟硬件兼容性評估;2026年與數家端側大模型公司建立戰略合作關系,共同推進“芯模聯動”生態體系建設。
在云側,微納核芯3D-CIM?架構采用局部數據循環系統,相比于GPU的數據搬運系統可大幅提高集群系統效率。目前公司已與數家云廠商和服務器廠商深度綁定,共同推動板級架構設計,爭取年內完成板卡送樣。