谷歌正式發(fā)布、開源新一代端側(cè)多模態(tài)大模型 Gemma 3n,以 "內(nèi)存效率革命" 突破設(shè)備端 AI 性能天花板。這款原生支持圖像、音頻、視頻和文本的模型,僅需 2GB 內(nèi)存即可運(yùn)行等效 50 億參數(shù)的 E2B 版本,其 E4B 版本在 100 億參數(shù)內(nèi)實(shí)現(xiàn)多模態(tài)任務(wù)全球最優(yōu)性能,LMArena 得分突破 1300 分,標(biāo)志著端側(cè) AI 進(jìn)入 "強(qiáng)算力輕量化" 時(shí)代。

谷歌開源 Gemma 3n:2G 內(nèi)存跑 100 億參數(shù)級(jí)多模態(tài)模型 端側(cè) AI 迎來(lái)性能革命.png

架構(gòu)革新:MatFormer 與 PLE 技術(shù)重塑端側(cè)計(jì)算邏輯

Gemma 3n 的核心突破源于全新 MatFormer(套娃 Transformer)架構(gòu),其創(chuàng)新的嵌套式設(shè)計(jì)如同俄羅斯套娃 —— 訓(xùn)練 80 億參數(shù)的 E4B 模型時(shí),同步優(yōu)化出獨(dú)立的 50 億參數(shù) E2B 子模型。這種設(shè)計(jì)賦予開發(fā)者雙重能力:
  • 預(yù)提取雙模型:直接使用高性能 E4B 模型,或調(diào)用輕量級(jí) E2B 實(shí)現(xiàn) 2 倍推理加速

  • Mix-n-Match 定制:通過(guò)動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)層維度,在 2-80 億參數(shù)間自由切分模型

搭配逐層嵌入(PLE)技術(shù),Gemma 3n 將非核心參數(shù)卸載至 CPU 計(jì)算,使 50 億參數(shù)的 E2B 模型僅需 2GB 加速器內(nèi)存(VRAM),較傳統(tǒng)架構(gòu)減少 60% 內(nèi)存占用。谷歌 AI 硬件團(tuán)隊(duì)負(fù)責(zé)人演示稱:"在 Pixel 8 手機(jī)上,Gemma 3n E2B 處理 1080p 視頻分析時(shí),功耗比前代降低 42%。"

多模態(tài)能力躍升:140 種語(yǔ)言支持與實(shí)時(shí)音視頻處理

作為端側(cè)首個(gè)全模態(tài)模型,Gemma 3n 在三大維度實(shí)現(xiàn)突破:
模態(tài)
技術(shù)創(chuàng)新
性能指標(biāo)
視覺
MobileNet-V5-300M 編碼器
Pixel 設(shè)備 60 幀 / 秒實(shí)時(shí)視頻分析
音頻
通用語(yǔ)音模型 (USM) 集成
30 秒音頻片段實(shí)時(shí)翻譯,AST 準(zhǔn)確率 91%
語(yǔ)言
多語(yǔ)言聯(lián)合訓(xùn)練
支持 140 種文本語(yǔ)言,跨模態(tài)理解 35 種
特別在語(yǔ)音翻譯場(chǎng)景中,Gemma 3n 通過(guò) "思維鏈" 提示技術(shù),使英西互譯的上下文連貫性提升 37%。某跨國(guó)企業(yè)測(cè)試顯示,使用該模型的客服團(tuán)隊(duì)在多語(yǔ)言支持成本上降低 58%。

開源生態(tài)布局:1.6 億次下載背后的端側(cè) AI 野心

隨著 Gemma 3n 開源,谷歌端側(cè) AI 模型累計(jì)下載量已突破 1.6 億次。此次開源套件包含:
  • 模型權(quán)重:E2B/E4B 基礎(chǔ)模型及 10 + 行業(yè)微調(diào)版本

  • 開發(fā)工具:MatFormer Lab 參數(shù)切分可視化工具

  • 應(yīng)用模板:相冊(cè)智能分類、會(huì)議實(shí)時(shí)轉(zhuǎn)寫等 20 個(gè)參考案例

"我們希望通過(guò) Gemma 3n,讓每臺(tái)手機(jī)都成為 AI 工作站。" 谷歌 AI 產(chǎn)品副總裁在發(fā)布會(huì)上表示。目前該模型已接入三星 Bixby、小米小愛同學(xué)等端側(cè)助手,預(yù)計(jì)年底前支持超 50 款主流設(shè)備。

行業(yè)影響:端側(cè) AI 進(jìn)入 "強(qiáng)模型本地化" 時(shí)代

IDC 分析師指出,Gemma 3n 的發(fā)布標(biāo)志著三大趨勢(shì):
  1. 算力平民化:2GB 內(nèi)存設(shè)備可運(yùn)行原需云端的強(qiáng)模型

  1. 數(shù)據(jù)隱私升級(jí):敏感數(shù)據(jù)無(wú)需上傳即可完成 AI 處理

  1. 開發(fā)門檻降低:非技術(shù)人員可通過(guò)預(yù)訓(xùn)練模型快速構(gòu)建應(yīng)用

值得關(guān)注的是,Gemma 3n 的彈性執(zhí)行設(shè)計(jì)(未來(lái)支持動(dòng)態(tài)切換模型規(guī)模)為物聯(lián)網(wǎng)設(shè)備提供了新可能。當(dāng)被問及是否對(duì)邊緣計(jì)算市場(chǎng)構(gòu)成沖擊時(shí),某芯片廠商負(fù)責(zé)人坦言:"這要求我們重新思考硬件與 AI 的協(xié)同架構(gòu)。"
隨著 Gemma 3n 代碼在 GitHub 上線,這場(chǎng)由谷歌發(fā)起的端側(cè) AI 性能革命,或?qū)⒅匦露x設(shè)備端智能的邊界。


來(lái)【龍頭AI網(wǎng)】了解最新AI資訊!