AMD 在 AI 领域的进展值得关注,尤其是其最新发布的针对 Stable Diffusion 模型的优化。近日,Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本,这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著,最高可达3.8倍。这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距,也为 AMD 用户带来了实实在在的好处。

过去一年,AMD 与多个合作伙伴,包括操作系统供应商(OSV)、原始设备制造商(OEM)和独立软件开发商(ISV),在硬件设计、驱动程序、编译器和机器学习模型等方面紧密合作,致力于提高 AMD 硬件的 AI 应用性能。根据 AMD 的官方数据,经过一系列优化后,SDXL1.0和 SDXL Turbo 在 AMD 硬件上的推理性能较基础的 PyTorch 模型提升了3.8倍,而 SD3.5的性能提升则达到2.6倍。

AMD显卡性能飞跃!Stable Diffusion 模型迎来优化大提升

在实际应用中,运行 SDXL1.0、SDXL Turbo、SD3.5Large 和 SD3.5Large Turbo 模型的 RX9070XT 显卡,其效率分别提升了3.1倍、1.5倍、3.3倍和2.1倍。与此同时,锐龙 AI MAX+395显卡在 SDXL1.0、SD3.5Large 和 SD3.5Large Turbo 的性能提升幅度分别为1.4倍、3.3倍和3.0倍。这样的性能改进让 AMD 显卡在图像和视频生成应用中表现更为出色。

此外,AMD 特别标注了优化版 Stable Diffusion 模型,使用 “_amdgpu” 后缀(例如:stable-diffusion-3.5-large_amdgpu),用户可以在 Stability AI 或 Hugging Face 平台上下载这一优化版本。同时,AMD 和 TensorStack AI 联合开发的 Amuse3.0版本也已上线,用户体验将更加流畅。值得注意的是,为了顺利使用这些优化模型,AMD GPU 驱动版本需不低于24.30.31.05的预览版,或等待即将发布的25.4.1正式版。

这一系列进展不仅提升了 AMD 显卡的 AI 应用能力,还为使用 AMD 硬件的开发者和用户带来了更多选择和灵活性。