近日,谷歌旗下的 Gemini 2.5 Pro 模型迎來重要更新,新版本「Gemini 2.5 Pro (0605)」正式亮相。此次更新后,Gemini 2.5 Pro 在性能表現(xiàn)上取得顯著突破,尤其在代碼、推理等關(guān)鍵任務(wù)領(lǐng)域展現(xiàn)出更強實力。
在極具挑戰(zhàn)性的 Humanity’s Last Exam(人類最后的考試)測試中,Gemini 2.5 Pro 新版以 21.6% 的成績超越 OpenAI o3,彰顯其在復(fù)雜知識與推理應(yīng)用方面的卓越能力。在 GPQA 測試里,它更是以 86.4% 的高分位居榜首,凸顯了強大的問題解答與分析水平。
大模型競技場的 Elo 評分結(jié)果也十分亮眼。相較于 (0506) 版本,Gemini 2.5 Pro 新版的 Elo 評分提升了 24 分,達到 1470 分,持續(xù)在眾多模型中占據(jù)領(lǐng)先地位,進一步鞏固了其在大模型領(lǐng)域的優(yōu)勢。
據(jù)谷歌介紹,本次 (0605) 版本是基于今年 I/O 大會上公布的 (0506) 版本構(gòu)建而成,并且新版極有可能作為 Gemini 2.5 Pro 的正式穩(wěn)定版與大眾見面。此外,谷歌針對新版 2.5 Pro 的回答進行了優(yōu)化改進,現(xiàn)在它能夠為用戶提供更具創(chuàng)意、格式更為優(yōu)化的答復(fù),極大提升了用戶與模型交互時的體驗。隨著 Gemini 2.5 Pro 新版的推出,其在大模型競爭中優(yōu)勢愈發(fā)明顯,有望為用戶帶來更多高效、智能的服務(wù)與體驗 。
來【龍頭AI網(wǎng)】了解最新AI資訊!
暫無評論
發(fā)表評論