在近期举行的 Advancing AI 2025 大会上,AMD不仅推出了备受瞩目的 Instinct MI350 系列 AI 加速卡和 ROCm 7 开发平台,更详细解读了其基于全新 Zen 5 架构的 锐龙线程撕裂者 9000 系列处理器 及 Radeon AI PRO 专业显卡 的技术细节。

此次发布旨在进一步巩固 AMD 在高性能工作站市场的领导地位,并获得了四大 OEM 合作伙伴的鼎力支持,共同展示了搭载新平台的领先产品。
工作站市场:稳健增长的专业高地
工作站市场作为介于服务器与个人 PC 之间的专业计算领域,以其对高性能、高可靠性的严苛要求而著称。IDC 数据显示,全球工作站市场规模预计将从 2024 年的近 700 万台增长至 2029 年的约 900 万台,展现出持续稳健的增长态势。

AMD 在该领域拥有完善且强大的产品线,从移动端的锐龙 AI PRO 系列到桌面级的锐龙 PRO、锐龙线程撕裂者 PRO 系列,以及 Radeon PRO、Radeon AI PRO 系列显卡,构建了完整的平台解决方案。

自 2017 年诞生以来,AMD 线程撕裂者处理器一直以其卓越性能主导市场。例如,上一代旗舰 线程撕裂者 PRO 7995WX 在多线程性能上相较英特尔至强 W9-3595X 领先高达 80%。值得强调的是,线程撕裂者系列始终保持高速迭代,仅用六年时间,其架构已进化四代,制造工艺从 14nm 跃升至 5nm,核心数增长 6 倍(从 16 核至 96 核),缓存容量扩大 12 倍,内存与 PCIe 带宽均实现了 4 倍提升,展现了 AMD 在技术创新上的不懈追求。
Zen 5 架构赋能:性能与能效的双重飞跃
线程撕裂者 9000 系列 的核心亮点在于全面升级至最新的 Zen 5 架构。

此架构带来了多项关键改进,包括:
• 显著提升的单线程与多线程性能:通过优化计算负载的全流水线处理能力,实现性能的质的飞跃。
• 512 位数据路径 AVX-512 指令集支持:提升了在高性能计算和 AI 工作负载中的处理效率。
• 增强的 ISA 指令能力:进一步优化了指令集架构,提升了代码执行效率。
• DDR5-6400 内存支持:提供高达 410GB/s 的理论峰值带宽,并支持 EXPO 一键超频至 DDR5-7000+。
• 更高能效:通过改进分支预测精度、同步多线程效率和功耗管理,实现同等功耗下更高的性能输出。

Zen 5 架构在 10 个工作站基准测试中,平均 IPC(每时钟周期指令数)提升达 16%,在 SPEC AI/ML 基准测试中平均 IPC 提升更是达到 25%。

线程撕裂者 9000 系列处理器延续了 Chiplets 整合封装设计,最多集成 12 个 4nm 工艺的 CCD 和 1 个 IOD,最高可实现 96 核心 192 线程。每个核心配备 1MB 二级缓存,每个 CCD 包含 8MB 二级缓存,所有核心共享 32MB 三级缓存,合计高达 480MB 缓存。

所有 PRO 9000WX 系列型号(9995WX、9985WX、9975WX、9965WX、9955WX、9945WX)和 9000 系列型号(9980X、9970X、9960X)的加速频率均提升至 5.4GHz,热设计功耗保持 350W。新系列继续兼容 sTR5 平台,为现有用户提供了便捷的升级路径。
性能实测:碾压级领先竞争对手

在实际应用负载中,旗舰型号 PRO 9995WX 相较于上一代 PRO 7955WX,性能提升幅度在 13% 到 26% 之间。

与竞品英特尔至强 W9-3595X (60 核心 120 线程) 相比,PRO 9995WX 展现出全面碾压态势。在 CPU 密集型应用中,其领先优势可轻松超过 100%。即使在需要 CPU 和 GPU 协同工作的负载下,PRO 9995WX 依然全面大幅领先。

面对最新的 AI 工作负载,无论是大模型 Tokens 生成速度、文生图速度,还是内容创作,PRO 9995WX 均表现出压倒性优势。即便是 64 核心的非专业级 9980X,也能够轻松领先至强 W9-3595X 至少 20%,最高甚至达到 108%。
Radeon AI PRO 显卡:AI 时代的专业图形利器
随着 AI 时代的到来,专业显卡在工作站中的作用愈发关键。AMD 将其专业显卡系列更名为 Radeon AI PRO,以突出其在 AI 领域的强大实力。Radeon AI PRO 显卡与锐龙 AI 处理器、内存等组件共同构成了完整的 AI 解决方案,并通过 ROCm 软件平台如虎添翼。

Radeon AI PRO 显卡基于 RDNA 4 架构,采用台积电 4nm 工艺,集成 539 亿个晶体管。新架构优化了指令处理器和缓存系统,并升级了第二代 AI 加速器,显著提升了 Tensor 计算能力,新增 8 位浮点数据格式并支持结构化稀疏性。

首款产品 Radeon AI PRO R9700 配备 64 个 CU 计算单元(4096 个流处理器)、64 个光追加速器和 128 个 AI 加速器,搭载 256-bit 32GB GDDR6 显存。其峰值性能在 FP16 半精度浮点下可达 96 TFLOPS,INT4 稀疏精度下为 1531 TOPS。整卡功耗 300W。值得一提的是,Radeon AI PRO R9700 将提供 AMD 公版及众多 AIB 品牌产品。

Radeon AI PRO R9700 相较于上一代 Radeon PRO W7800,在核心数更少的情况下,实现了 FP32 性能持平,FP16/BF16 性能翻倍,INT8/INT4 性能更是达到 4 倍,并新增了 FP8 和结构化稀疏性支持。

在 DeepSeek-R1 大模型输出 Tokens 速度测试中,R9700 可轻松碾压 W7800,尤其在 70-80 亿参数规模时优势显著,甚至领先一倍有余。32GB 显存配置能够满足流行大模型的典型显存占用需求,并预留未来扩展空间。

Radeon AI PRO R9700 还支持灵活的多卡并行,目前最多可实现四卡并行,后续将升级至八卡,以更好地满足并发实例应用。
OEM 伙伴:强强联合,共筑工作站生态
AMD 线程撕裂者系列凭借其卓越性能和完善的软件生态,已获得行业广泛认可。戴尔、惠普、联想、超微等全球领先的 OEM 伙伴持续为 AMD 提供大力支持。

• 戴尔 Precision 7875 工作站:支持撕裂者 PRO 7000WX/9000WX 系列,最高 96 核心,提供高达 2TB DDR5 内存和丰富的扩展插槽。
• 惠普 Z6 G5 A 工作站:已加入撕裂者 PRO W9000X 系列,同时支持最新的 NVIDIA Blackwell 专业显卡,最多三卡并行。
• 联想 ThinkStation P620、P8:联想作为 AMD 工作站的头号伙伴,其 P8 系列已升级支持撕裂者 PRO 9000WX,最高 96 核心。
• 超微工作站:提供多样化产品,包括标准塔式(可选风冷、液冷)及独特的 2U 机架式,可支持最多四块全高全长双插槽专业显卡并行。
结语:撕裂者神话续写,AMD YES 精神永存

自 2017 年诞生以来,锐龙线程撕裂者处理器一直是高性能计算领域的标杆,甚至迫使竞争对手放弃了高端桌面市场,创造了微处理器历史上的一个“神话”。尽管缺乏直接竞争威胁,线程撕裂者系列却打破了“挤牙膏”的惯例,每一代都在超越自我。

最新的线程撕裂者 9000 系列秉持初心,以全新的 Zen 5 架构再次诠释了“AMD YES”的精髓。其无与伦比的性能再次飞跃,全方位碾压竞品;更丰富的 I/O 接口,轻松实现各种扩展;更高超的能效,有效降低客户部署成本;以及第一时间推出的丰富 OEM 产品,灵活满足用户不同需求。
搭配全新的 Radeon AI PRO 专业显卡和 ROCm 7 开发软件,线程撕裂者 9000 系列组成了迄今为止最为强大的专业工作站解决方案,无论是图形渲染还是高强度 AI 负载,都能轻松应对,为专业人士提供无与伦比的计算体验。
请登录以参与评论
现在登录