近日,MiniMax 宣布推出其最新大模型 ——MiniMax-M1,這也是全球首個開源的大規(guī)模混合架構(gòu)推理模型。官方數(shù)據(jù)顯示,M1 在生產(chǎn)力復(fù)雜場景中的表現(xiàn)已超越國內(nèi)閉源模型,接近海外最領(lǐng)先的商業(yè)模型,性價比在業(yè)內(nèi)也處于領(lǐng)先地位。

MiniMax 深夜發(fā)布 M1:全球首個開源大規(guī)?;旌霞軜?gòu)推理模型.jpg

M1 的關(guān)鍵技術(shù)優(yōu)勢顯著,其支持最高 100 萬 Token 上下文輸入窗口,這一長度與 Google Gemini 2.5 Pro 相當(dāng),達(dá)到目前業(yè)內(nèi)最長水準(zhǔn),是 DeepSeek R1 的 8 倍;同時,它支持最長 8 萬 Token 的推理輸出,遠(yuǎn)超多數(shù)同類模型。該模型的高性能得益于其自主研發(fā)的閃電注意力機(jī)制主導(dǎo)的混合架構(gòu),這種架構(gòu)使模型在處理長上下文與深度推理任務(wù)時,仍能保持極高的計算效率。
在強化學(xué)習(xí)訓(xùn)練方面,MiniMax 采用了自主提出的 CISPO 算法。官方數(shù)據(jù)表明,在 AIME 實驗中,CISPO 訓(xùn)練效率比字節(jié)跳動近期提出的 DAPO 快一倍,也優(yōu)于 DeepSeek 早期使用的 GRPO 算法。整個強化訓(xùn)練階段僅使用 512 塊 H800 GPU 訓(xùn)練三周,租賃成本控制在 53.74 萬美元,遠(yuǎn)低于業(yè)內(nèi)普遍成本。
MiniMax 還宣布,M1 模型在其 APP 與 Web 端提供不限量免費使用,并推出業(yè)內(nèi)低價 API 服務(wù)。具體來看,0-32k 輸入長度下,輸入價格為 0.8 元 / 百萬 token,輸出 8 元 / 百萬 token;32k-128k 輸入價格為 1.2 元 / 百萬 token,輸出 16 元 / 百萬 token;最長 128k-1M 輸入價格為 2.4 元 / 百萬 token,輸出 24 元 / 百萬 token。部分定價區(qū)間已低于 DeepSeek-R1,長上下文能力則領(lǐng)先其不支持的區(qū)間。
MiniMax 相關(guān)負(fù)責(zé)人表示,M1 發(fā)布僅是開端,接下來四個工作日內(nèi)還將持續(xù)發(fā)布更多新產(chǎn)品和更新。此次 M1 的發(fā)布,為開源模型領(lǐng)域注入新的活力,有望推動相關(guān)領(lǐng)域的進(jìn)一步發(fā)展。

來【龍頭AI網(wǎng)】了解最新AI資訊!