谷歌正式發(fā)布、開源新一代端側(cè)多模態(tài)大模型 Gemma 3n,以 "內(nèi)存效率革命" 突破設(shè)備端 AI 性能天花板。這款原生支持圖像、音頻、視頻和文本的模型,僅需 2GB 內(nèi)存即可運(yùn)行等效 50 億參數(shù)的 E2B 版本,其 E4B 版本在 100 億參數(shù)內(nèi)實(shí)現(xiàn)多模態(tài)任務(wù)全球最優(yōu)性能,LMArena 得分突破 1300 分,標(biāo)志著端側(cè) AI 進(jìn)入 "強(qiáng)算力輕量化" 時(shí)代。

架構(gòu)革新:MatFormer 與 PLE 技術(shù)重塑端側(cè)計(jì)算邏輯
Gemma 3n 的核心突破源于全新 MatFormer(套娃 Transformer)架構(gòu),其創(chuàng)新的嵌套式設(shè)計(jì)如同俄羅斯套娃 —— 訓(xùn)練 80 億參數(shù)的 E4B 模型時(shí),同步優(yōu)化出獨(dú)立的 50 億參數(shù) E2B 子模型。這種設(shè)計(jì)賦予開發(fā)者雙重能力:
搭配逐層嵌入(PLE)技術(shù),Gemma 3n 將非核心參數(shù)卸載至 CPU 計(jì)算,使 50 億參數(shù)的 E2B 模型僅需 2GB 加速器內(nèi)存(VRAM),較傳統(tǒng)架構(gòu)減少 60% 內(nèi)存占用。谷歌 AI 硬件團(tuán)隊(duì)負(fù)責(zé)人演示稱:"在 Pixel 8 手機(jī)上,Gemma 3n E2B 處理 1080p 視頻分析時(shí),功耗比前代降低 42%。"
多模態(tài)能力躍升:140 種語(yǔ)言支持與實(shí)時(shí)音視頻處理
作為端側(cè)首個(gè)全模態(tài)模型,Gemma 3n 在三大維度實(shí)現(xiàn)突破:
| | |
| | Pixel 設(shè)備 60 幀 / 秒實(shí)時(shí)視頻分析 |
| | 30 秒音頻片段實(shí)時(shí)翻譯,AST 準(zhǔn)確率 91% |
| | 支持 140 種文本語(yǔ)言,跨模態(tài)理解 35 種 |
特別在語(yǔ)音翻譯場(chǎng)景中,Gemma 3n 通過(guò) "思維鏈" 提示技術(shù),使英西互譯的上下文連貫性提升 37%。某跨國(guó)企業(yè)測(cè)試顯示,使用該模型的客服團(tuán)隊(duì)在多語(yǔ)言支持成本上降低 58%。
開源生態(tài)布局:1.6 億次下載背后的端側(cè) AI 野心
隨著 Gemma 3n 開源,谷歌端側(cè) AI 模型累計(jì)下載量已突破 1.6 億次。此次開源套件包含: "我們希望通過(guò) Gemma 3n,讓每臺(tái)手機(jī)都成為 AI 工作站。" 谷歌 AI 產(chǎn)品副總裁在發(fā)布會(huì)上表示。目前該模型已接入三星 Bixby、小米小愛同學(xué)等端側(cè)助手,預(yù)計(jì)年底前支持超 50 款主流設(shè)備。
行業(yè)影響:端側(cè) AI 進(jìn)入 "強(qiáng)模型本地化" 時(shí)代
IDC 分析師指出,Gemma 3n 的發(fā)布標(biāo)志著三大趨勢(shì):
算力平民化:2GB 內(nèi)存設(shè)備可運(yùn)行原需云端的強(qiáng)模型
數(shù)據(jù)隱私升級(jí):敏感數(shù)據(jù)無(wú)需上傳即可完成 AI 處理
開發(fā)門檻降低:非技術(shù)人員可通過(guò)預(yù)訓(xùn)練模型快速構(gòu)建應(yīng)用
值得關(guān)注的是,Gemma 3n 的彈性執(zhí)行設(shè)計(jì)(未來(lái)支持動(dòng)態(tài)切換模型規(guī)模)為物聯(lián)網(wǎng)設(shè)備提供了新可能。當(dāng)被問及是否對(duì)邊緣計(jì)算市場(chǎng)構(gòu)成沖擊時(shí),某芯片廠商負(fù)責(zé)人坦言:"這要求我們重新思考硬件與 AI 的協(xié)同架構(gòu)。"
隨著 Gemma 3n 代碼在 GitHub 上線,這場(chǎng)由谷歌發(fā)起的端側(cè) AI 性能革命,或?qū)⒅匦露x設(shè)備端智能的邊界。
來(lái)【龍頭AI網(wǎng)】了解最新AI資訊!
暫無(wú)評(píng)論
發(fā)表評(píng)論