AMD 公布 AI 路线图:MI325X 将比 H200 快 1.3 倍!还有全新 AI PC 芯片!

Wallstreetcn
2024.06.03 05:14
portai
I'm PortAI, I can summarize articles.

AMD 在 Computex 2024 展会上公布了全新的 AI 路线图,将推出 MI325X 和 Strix Point 系列芯片。MI325X 的 AI 性能将比英伟达 H200 提升 1.3 倍,将于今年第四季度开始供货。另外,AMD 还计划在 2025 年推出 MI350 系列,该系列芯片将具有更快的推理运算速度。这些新芯片将带来更高的性能和更好的性价比。

6 月 3 日,AMD 董事长兼 CEO 苏姿丰在 Computex 2024 展会的开幕主题演讲中,公布了全新云端 AI 加速芯片路线图,今年将会推出全新 Instinct MI325X。同时,AMD 还发布了代号为 “Strix Point” 的第三代 AI PC 芯片 “锐龙 AI 300 系列”,以及 AMD Ryzen 9000 系列桌面处理器(Granite Ridge)。

今年将推出 MI325X,性能相比英伟达 H200 提升 1.3 倍

根据 AMD 公布的全新云端 AI 加速芯片路线图显示,AMD 今年将会推出全新的 AI 加速芯片 Instinct MI325X,2025 年推出 MI350,2026 年推出 MI400。

据介绍,MI325X 将延续 CDNA3 构架,采用第四代高带宽内存 (HBM) HBM3E,容量大幅提升至 288GB,内存带宽也将提升至 6TB/s,整体的性能将进一步提升,其他方面的规格则基本保持与 MI300X 一致,便于客户的产品升级过渡。

苏姿丰指出,MI325X 的 AI 性能提升幅度为 AMD 史上最大,相较竞品英伟达 H200 将有 1.3 倍以上的提升,同时更有性价比优势,MI325X 将于今年第四季度开始供货。

另外,AMD 还将在 2025 年推出新一代的 MI350 系列,该系列芯片将采用 3nm 制程,基于全新的构架,集成 288GB HBM3E 内存,并支持 FP4/FP6 数据格式,推理运算速度较现有 MI300 系列芯片快 35 倍。

据供应链信息透露,MI350 将进入液冷世代,为 AI 服务器运算提供更强的算力、更佳的能源效率。

2026 年,AMD 还将会推出新一代的 MI400 系列,保持一年一更新的节奏。

AMD 锐龙 AI 300 系列发布:AI 算力高达 50TOPS!

早在 2023 年初,AMD 就发布了锐龙 7040 系列 (代号 Pheonix) 的全球首款集成独立 NPU AI 引擎的 x86 处理器,基于全新设计的 XDNA 架构,算力约 10TOPS(每秒 10 万亿次浮点运算),加上 CPU、GPU 整体算力约 33TOPS,开创了 AI PC 的新时代。

2023 年底,AMD 又推出了锐龙 8040 系列 (代号 Hawk Point),NPU AI 算力一举提升了 60%,达到约 16TOPS,整体算力也提升至 39TOPS。

而最新的代号为 Strix Point 的 “锐龙 AI 300 系列”,则采用了全新的 Zen5 PU 架构,GPU 内核也升级为了 RDNA3.5 架构,NPU 也是全新的 XDNA2 架构,号称是 “面向下代 AI PC/Copilot+ PC 的世界一流处理器”。

锐龙 AI 300 系列首发只有两款型号,“锐龙 AI 9 HX 370” 和 “锐龙 AI 9 HX 365” 都定位高端市场。

其中,“锐龙 AI 9 HX 370” 是顶级旗舰,CPU 部分拥有 12 核心 24 线程,多年来首次在这一定位上提供更多核心,相比锐龙 8040 系列增加了多达 1/3。二级缓存还是每核心 1MB,总容量自然增加到 12MB。三级缓存终于打破了 16MB 的 “禁锢”,增加了足足一半来到 24MB。最高主频 5.1GHz。GPU 部分不但升级架构,CU 单元数量也从 12 个增至 16 个,命名为 “Radeon 890M”。NPU 算力则提升到了 50TOPS,增加了 2 倍有余。

“锐龙 AI 9 365” 也是高端型号,10 核心 20 线程,二级缓存 10MB,三级缓存仍为 24MB,最高频率达 5.0GHz,NPU 算力也是 50TOPS,GPU 部分也是 Radeon 890M。

从 AMD 第一和第二代 XDNA NPU 架构的对比图中,可以看到整体布局基本一致,但规模大大扩充。

AI Tile(初代叫 AIE Tile) 也就是核心的 AI 计算引擎模块,从之前的 20 个增加到 32 个,再加上本身的增强。

Mem Tile 也就是本地内存模块,从原来的 5 个增加到 8 个,可以更好地配合更大规模的本地调度、运算。

另外,用于互连的交叉总线也从普通的 Data Fabric,升级为 Zen/RDNA 家族上无处不在的 Infinity Fabric,传输带宽和效率更高。

AMD 声称,XDNA2 NPU 的计算能力提升了多达 5 倍,多任务并行能力翻了一番,能效也提升了最多 2 倍。

需要指出的是,这里说的 AI 算力提升 5 倍,是指的 Llama 2 70 亿参数大模型的响应速度,从启动到获得第一个 token,锐龙 AI 9 HX 370 达到了锐龙 9 8940HS 的多达 5 倍。

另外非常关键的一点,XDNA2 首发引入了全新的 Block FP16 浮点精度,也就是 BFloat16、BF16。它在 CPU、GPU 上已经很常见,而在 NPU 上还是第一次。

传统的 FP8 浮点格式性能高而精度不足,FP16 浮点格式精度高而性能略逊,而将二者融合起来的 BF16 可以在精度、性能上达到较好的平衡,灵活性也更高。

同时,大多数 AI 应用都采用了 16 位精度,因此有了 BF16,不再需要量化为 8 位精度,减少了转换步骤,提高了执行效率。

高通骁龙 X Elite NPU 的算力为 45TOPS,Intel 即将推出的下一代酷睿 Ultra Lunar Lake NPU 算力同样是 45TOPS,锐龙 AI 300 系列则一举超越二者,成为当今最强 NPU。

至于苹果 M4,其 NPU 的算力只有区区 38TOPS,还不到 Windows 阵营这边 Copilot+ PC 的最低算力需求门槛 40TOPS。

随着算力的大幅提升,NPU 的应用也将不再局限于一些持续性低负载场景 (比如视频会议),而是有了更多可能,一方面可以在更多场景中部分取代 CPU、GPU,以更高的能效执行 AI 运算,大大提升笔记本的续航能力。

另一方面,更强力的 NPU 配合更强力的 CPU、GPU,可以在更多场景中部署端侧 AI,进一步摆脱对云侧的依赖,最大好处就是可以避免隐私泄露和安全威胁。

当然,硬件算力再强,也需要生态应用的落地配合。作为 AI PC 的先行者,AMD 2024 年内的 ISV 合作厂商将超过 150 家,既有 Adobe、微软、Topaz Labs 这样的世界级大厂,也有百川智能、钉钉、、无问芯穹、有道这样的国内名企,前途不可限量。

新一代 AI PC 的最大亮点就是配合最新的 Windows 系统,可以打造全新的 Copilot+ 体验,比如历史回忆、视频会议实时录制与翻译、协同创作等。

官方提供的数据显示,锐龙 AI 9 HX 370 对比高通骁龙 X Elite,日常办公、生产力创作、多任务、图形等各方面都遥遥领先,尤其是图形计算性能高出了 73%。

对比英特尔目前最强的酷睿 Ultra 9 185H,无论是日常应用还是游戏,都有着大幅的提升,平均性能提升 36%。就看英特尔下一代 Lunar Lake 的表现了。

对比苹果 M3,锐龙 AI 9 HX 370 在各方面也都有着很大的性能优势,特别是在 3D 性能上,超出了 98%。

锐龙 AI 300 系列的笔记本将从 7 月份起陆续上市,目前已有 100 多款设计,涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要 OEM 品牌。

华硕会在台北电脑展上宣布一系列配备锐龙 AI 300 系列处理器的笔记本,其中轻薄本有 16 英寸的灵耀 (Zenbook S)、14/15/16 英寸的无畏 (Vivobook S),创作本有 16 和 13 英寸的 ProArt P16/X13,游戏本有 16 英寸的 ROG 幻系列、14/16 英寸的天选系列 (TUF GAMING A14/A16)。

微星首批三款,都是 16 寸大屏机型,包括面向高端商务办公的 Summit A16 AI+,轻薄全能游戏型的绝影 A16 AI+、主打超薄商务与创作的尊爵 A16 AI+。

AMD Zen5 Ryzen 9000 系列发布:性能比 i9-14900K 快 56%

全新发布的 AMD Ryzen 9000 系列桌面处理器(Granite Ridge),基于 Zen5 构架,第一批产品将于 2024 年 7 月推出。

苏姿丰强调,Ryzen 9000 系列是继 Ryzen 7000“Raphael” 和 Ryzen 8000“Hawk Point” 系列之后,AM5 插槽的第三个系列,将配备两个 Zen5 小芯片,每个小芯片最多有 8 个核心,最高 16 个内核和 32 线程,与 Ryzen 7000 系列类似。AMD 还继续支持 SMT(同时多线程功能)。

AMD 首批推出了四款 CPU 产品,都配有 2CU RDNA2 集显:

Ryzen 9 9950X 配备 16 核心 32 线程,170W TDP,最高主频 5.7 GHz;

Ryzen 9 9900X 配备 12 核心 24 线程,120W TDP,最高主频 5.6 GHz;

Ryzen 7 9700X 配备 8 核心 16 线程,65W TDP,最高主频 5.5 GHz;

Ryzen 5 9600X 配备 6 核心 12 线程,65W TDP,最高主频 5.4 GHz。

根据 AMD 官方测试,其 Zen 5 内核面向 PC 平台的 IPC 性能相比 Zen 4 平均提升了约 16%。

与英特尔 Core i9-14900K 相比,AMD 旗舰 16 核心 Ryzen 9 9950X 在游戏性能测试中的速度快 4% 到 23%。在生产力性能测试中,9950X 显示出更大的优势,比英特尔 Core i9-14900K 快 7% 至 56%。

AMD 宣布 Ryzen 9000 系列将于 7 月 31 日推出,具体定价细节将很快将会公布。