AMD 称 RX 7900 XTX 显卡运行 DeepSeek AI 性能领先英伟达竞品
发布时间:2025-01-30 20:25:32来源:
1 月 30 日讯,AMD 于今日凌晨公布了新一代显卡的 AI 推理性能数据,其旗舰型号 RX 7900 XTX 在 DeepSeek R1 大模型测试中展现出显著的差异化竞争优势,部分性能表现超越英伟达的 RTX 4090,与 RTX 4080 Super 相比差距更是明显。
在此次测试中,AMD 采用多参数模型配置方案,涵盖了从 7B 至 32B 不同参数规模的模型。结果显示,当运行 Qwen 7B 蒸馏模型时,RX 7900 XTX 的处理速度较英伟达 RTX 4090 提升了 13%,而与 RTX 4080 Super 对比,最高性能差距拉开至 34%。在 7B 至 14B 参数范围内,RX 7900 XTX 相较 RTX 4090 保持着 2%-13% 的性能优势;不过在 32B 参数场景下,RX 7900 XTX 以 4% 的微弱差距稍落后于 RTX 4090。即便如此,在面对 RTX 4080 Super 时,RX 7900 XTX 在 32B 参数下仍能保持 22% 的性能领先,且随着模型复杂度增加,领先幅度从最高 34% 逐渐递减至 22% 。
从技术层面来看,AMD 的 RDNA3 架构集成了 192 个专用计算模块,支持双精度浮点与整型混合运算。虽然该架构并非专为 AI 设计,但 AMD 近期推出的《DeepSeek R1 部署方案》实现了消费级硬件与大模型框架的深度适配。测试中所采用的 DeepSeek R1 框架通过底层指令集优化,相较于传统方案,运行效率提升了 11 倍,创新性地整合了多厂商硬件加速指令,充分挖掘了 RX 7900 XTX 的潜力。
当前,消费级显卡在 AI 计算领域的应用渗透率已突破 17%,这促使硬件厂商不断加速架构升级。值得注意的是,此次测试并未启用英伟达的 TensorRT 等专用加速引擎,却揭示出非专用 AI 架构显卡的潜在计算效能,也让市场看到了 AMD 显卡在 AI 计算领域的竞争力 。
随着 AI 技术的飞速发展,消费级显卡在 AI 推理等应用场景中的需求日益增长。AMD 此次公布的测试数据,无疑为其在竞争激烈的显卡市场中赢得了更多关注,也为消费者在选择 AI 计算硬件时提供了新的参考。未来,随着技术的进一步优化和应用场景的拓展,AMD 与英伟达在 AI 计算领域的竞争态势值得持续关注。
(责编: admin1)
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。