近日,蘋(píng)果公司宣布更新人工智能模型,為 iOS、macOS 等系統(tǒng)上的 Apple Intelligence 功能提供支持。然而,從蘋(píng)果自身公布的數(shù)據(jù)來(lái)看,新模型性能表現(xiàn)欠佳,在與對(duì)手產(chǎn)品的比較中處于下風(fēng)。
蘋(píng)果最新的 “蘋(píng)果設(shè)備端(Apple On-Device)” 模型可在 iPhone 等設(shè)備本地運(yùn)行,無(wú)需聯(lián)網(wǎng)。經(jīng)人類(lèi)測(cè)試者評(píng)估,其生成文本質(zhì)量與谷歌、阿里巴巴同規(guī)模模型 “相當(dāng)”,但未實(shí)現(xiàn)超越。而 “蘋(píng)果服務(wù)器(Apple Server)” 模型,運(yùn)行于公司數(shù)據(jù)中心,本應(yīng)更強(qiáng)大,卻在測(cè)試中落后于 OpenAI 一年前推出的 GPT-4o。
在圖像分析能力測(cè)試中,蘋(píng)果模型同樣表現(xiàn)平平。蘋(píng)果數(shù)據(jù)顯示,人類(lèi)評(píng)估者更青睞 Meta 的 Llama 4 Scout 模型,即便 Llama 4 Scout 在多項(xiàng)測(cè)試中遜于谷歌、Anthropic 和 OpenAI 等實(shí)驗(yàn)室的領(lǐng)先模型,這一結(jié)果著實(shí)令人意外。
此次模型更新,進(jìn)一步印證蘋(píng)果人工智能研究部門(mén)在激烈競(jìng)爭(zhēng)中掉隊(duì)的現(xiàn)狀。近年來(lái),蘋(píng)果 AI 能力表現(xiàn)平淡,萬(wàn)眾期待的個(gè)性化 Siri 升級(jí)更是無(wú)限期推遲,甚至還因宣傳未實(shí)現(xiàn)的 AI 功能遭用戶訴訟。
據(jù)悉,新的 “Apple On-Device” 模型擁有約 30 億參數(shù),主要用于文本生成、總結(jié)與分析等功能。從本周一開(kāi)始,第三方開(kāi)發(fā)者可通過(guò)蘋(píng)果 Foundation Models 框架接入該模型。蘋(píng)果表示,“Apple On-Device” 和 “Apple Server” 兩款模型在工具使用和效率上有所提升,能理解約 15 種語(yǔ)言,這得益于擴(kuò)展的訓(xùn)練數(shù)據(jù)集,其中涵蓋圖像、PDF 文件、文檔等多種類(lèi)型數(shù)據(jù) 。盡管蘋(píng)果在模型優(yōu)化上有所行動(dòng),但在競(jìng)爭(zhēng)激烈的 AI 領(lǐng)域,如何提升模型性能、追趕對(duì)手,仍是蘋(píng)果亟待解決的難題。
來(lái)【龍頭AI網(wǎng)】了解最新AI資訊!
暫無(wú)評(píng)論
發(fā)表評(píng)論