华人大神领军,AMD显卡AI“炼丹”能力媲美RTX 4090八成性能
侧边栏壁纸
  • 累计撰写 65,187 篇文章
  • 累计收到 0 条评论

华人大神领军,AMD显卡AI“炼丹”能力媲美RTX 4090八成性能

James
2023-08-13 / 0 评论 / 5 阅读 / 正在检测是否收录...


NVIDIA显卡在游戏和AI加速方面一直占据领先地位。从A100/H100等显卡的热门程度可以看出,科技巨头们都在竞相争夺。此外,就连GeForce游戏卡也成为普通人用于AI加速的选择。然而,AMD显卡在这个领域一直相对落后。但是,好消息是,现在AMD也在紧追不断。近期,深度学习领域的华人大神、OctoML的CTO陈天奇,携手团队为AMD显卡带来了大模型推理方案。这意味着在AI领域,有了除NVIDIA之外的另一个选择,不再局限于N卡的供应紧张和高价困扰。

陈天奇优化算法的成功应用,让RX 7900 XTX显卡在Llama2的7B和13B大模型上展现出令人满意的性能。这种性能已经接近甚至超越了RTX 4090显卡的82%和RTX 3090 Ti显卡的94%水平。【插入图片1:RX 7900 XTX显卡】。而这不仅仅是性能上的迎头赶上,还体现在性价比上。RX 7900 XTX显卡与其他两款显卡一样拥有24GB显存,但售价仅为999美元,而RTX 4090和RTX 3090 Ti则分别高达1599和1999美元,价格相比高出60-100%。当然,实际售价可能会比999美元更为优惠,而N卡价格则一直维持在较高水平。【插入图片2:价格比较】。

除了性能的提升,AMD显卡的AI炼丹能力也因此得以突破。尤其是RX 7900 XTX这样的游戏卡,其AI加速性能有了质的飞跃。而这背后不仅仅是硬件的进步,也归功于AMD近期对ROCm软件生态的改进。此前,ROCm对游戏卡和Windows平台的支持相对不足,但从今年4月开始,不仅扩展支持到Windows系统,还增加了对RX 7900和工作站显卡的兼容性。此外,AMD还发布了ROCm HIP SDK,使开发者可以轻松地将之前针对CUDA平台开发的代码迁移到AMD平台上。这也为陈天奇等专家在AMD显卡上推动AI能力提升提供了坚实基础。

0