國產(chǎn)大模型公司MiniMax6月1日正式發(fā)布新一代通用模型MiniMax M3。據(jù)介紹,M3采用全新的自研稀疏注意力架構(gòu)MiniMax Sparse Attention(MSA),在編程及智能體能力、超長上下文及原生多模態(tài)等多個關(guān)鍵方向,均實現(xiàn)代際突破。
MiniMax披露,在100萬上下文規(guī)模下,M3單詞元(Token)計算量僅為上一代模型的約二十分之一,推理效率顯著提升。
從底層注意力機制重構(gòu)百萬詞元上下文
MiniMax M3是具備“前沿 Coding 能力”“1M超長上下文”“原生多模態(tài)”三項核心能力的大模型,而支撐MiniMax M3三大能力合一的,是其自研的稀疏注意力架構(gòu)MSA(MiniMax Sparse Attention)。
相較傳統(tǒng)全注意力機制,MSA能顯著降低長上下文下的計算成本,并將上下文窗口提升至100萬詞元,這意味著模型在處理長文檔、復雜代碼倉庫、多輪任務(wù)協(xié)作等場景時,能夠在一次推理中保留更完整的信息鏈路。MiniMax披露,在100萬上下文規(guī)模下,M3單詞元計算量僅為上一代模型的約二十分之一,推理效率顯著提升。
除模型架構(gòu)升級外,MiniMax在底層推理算子層面也開展了進一步優(yōu)化。據(jù)披露,通過重新設(shè)計數(shù)據(jù)讀取與計算路徑,相關(guān)性能較主流開源方案提升4倍以上。
業(yè)內(nèi)人士認為,全球大模型競賽正在突出新的變量。隨著智能體(Agent)任務(wù)復雜度不斷提高,“更長上下文”“更穩(wěn)定記憶”“更低成本推理”正成為決定產(chǎn)品可用性的關(guān)鍵能力。
AI進入實際執(zhí)行層的速度加快
MiniMax M3在編程和智能體訓練中引入了交互式用戶模擬器框架,通過模擬真實開發(fā)者在協(xié)作過程中的行為模式,讓模型在訓練和評測階段就接觸到更接近生產(chǎn)環(huán)境的交互場景。
業(yè)內(nèi)人士認為,從代碼開發(fā)、研究分析到跨應用協(xié)同執(zhí)行,編程和自主代理能力正逐步成為全球頭部模型的新競爭焦點。此次MiniMax重點強化這一能力,也被視為對下一階段AI產(chǎn)品形態(tài)的提前布局。
原生多模態(tài)也是MiniMax M3的顯著特點之一。MiniMax相關(guān)負責人表示,MiniMax M3從訓練起點便采用文本、圖片、視頻等多模態(tài)混合訓練,并在數(shù)據(jù)規(guī)模和訓練管線上進一步擴展。模型不僅支持圖像與視頻理解,也具備桌面操作能力,可在復雜跨應用環(huán)境中執(zhí)行計算機操作任務(wù)。
總體上看,大模型能力正在從語言理解進一步向真實數(shù)字環(huán)境延伸。無論是辦公自動化、企業(yè)軟件操作還是更復雜的生產(chǎn)力場景,AI進入實際執(zhí)行層的速度正在明顯加快。
MiniMax啟動A股IPO
MiniMax近日已啟動A股IPO進程。據(jù)證監(jiān)會網(wǎng)站消息,MiniMax已于2026年5月29日同中信證券簽署輔導協(xié)議。
5月31日,MiniMax在港交所公告,董事會宣布已決議探究擬發(fā)行人民幣股份的初步建議。公司在香港聯(lián)交所成功上市后,公司持續(xù)評估資本市場,包括對在科創(chuàng)板上市進行評估。截至本公告日期,公司已聘請專業(yè)顧問就公司符合在科創(chuàng)板上市的條件提供咨詢,并已簽訂輔導協(xié)議。
公告稱,擬發(fā)行人民幣股份事宜將取決于市場狀況及必要的監(jiān)管批準。公司股東及潛在投資者買賣公司股票時請審慎行事。
MiniMax今年1月登陸港交所。在港股上市首日,MiniMax股價就大漲翻倍,隨后更是接連大漲,最高至1330港元/股。