在 AMD Advancing AI 2025 活動中,AMD 正式推出下一代開源軟件棧技術(shù) ROCm 7,旨在進(jìn)一步加速 AI 發(fā)展,提升開發(fā)者生產(chǎn)力。
ROCm 7 的發(fā)布,標(biāo)志著 AMD 在軟件棧領(lǐng)域的重大進(jìn)展。過去幾年,特別是 AI 計算興起后,ROCm 6 軟件棧歷經(jīng)多次更新,而此次 ROCm 7 的發(fā)布,更是為 AI 領(lǐng)域帶來了諸多新特性。
在功能方面,ROCm 7 聚焦于最新算法與模型、用于擴(kuò)展 AI 的高級功能、MI350 系列支持、集群管理以及企業(yè)級功能。通過 ROCm 7,AMD 更加關(guān)注其軟件堆棧中推理能力的提升。該堆棧將包含增強型框架,如 vLLM v1、llm-d、SGLang 等,并提供多種優(yōu)化。即將推出的新內(nèi)核和算法包括 GEMM 自動調(diào)優(yōu)、MoE、Attention 以及基于 Python 的內(nèi)核編寫。
性能上,AMD 強調(diào) ROCm 7 將推理作為重點,為 AI 工作負(fù)載帶來顯著性能提升,最高可達(dá) 3.5 倍。具體到模型表現(xiàn)上,相較于 ROCm 6,ROCm 7 在 Llama 3.1 70B 模型上提升了 3.2 倍,Qwen2-72B 模型提升了 3.4 倍,DeepSeek R1 模型更是提升了 3.8 倍。
此外,AMD 宣布對 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也全面支持這些高級數(shù)據(jù)類型,如 FP8、FP6、FP4 以及混合精度。
AMD 在 AI 領(lǐng)域持續(xù)發(fā)力,ROCm 7 的推出有望助力開發(fā)者更高效地開發(fā) AI 應(yīng)用,推動 AI 技術(shù)進(jìn)一步發(fā)展,其在實際應(yīng)用中的表現(xiàn)值得關(guān)注。
來【龍頭AI網(wǎng)】了解最新AI資訊!
暫無評論
發(fā)表評論