英伟达H100:炼大模型的抢手宠儿,供应紧张直至2024年
侧边栏壁纸
  • 累计撰写 65,187 篇文章
  • 累计收到 0 条评论

英伟达H100:炼大模型的抢手宠儿,供应紧张直至2024年

James
2023-08-12 / 0 评论 / 8 阅读 / 正在检测是否收录...


炼制庞大模型最佳GPU,英伟达H100,已经一抢而空!即使您立刻下订单,也要等到2024年第一季度甚至第二季度才能获得交付。这一消息来自英伟达亲密伙伴,云服务提供商CoreWeave,向华尔街日报透露了最新的供应情况。从四月初开始,供应链紧张情况愈发严重,短短一周内,预计交货时间从合理水平跃升至年底。

全球最大的云服务提供商亚马逊AWS也证实了这一消息。其CEO亚当·塞利普斯基最近表示:"A100和H100是目前最先进的GPU……即便对于AWS,获得这些也十分困难。" 甚至埃隆·马斯克在某次访谈中也曾表示:"现在获得GPU都比星际飞船还难。"

购买原装GPU遇到高达25%的溢价,例如在Ebay上,价格从出厂价的约36000美元飙升至45000美元,且货源供不应求。于此形势下,国内的科技巨头百度、字节、阿里巴巴、腾讯等公司共向英伟达下了总额达50亿美元的A800等芯片订单。其中,仅有10亿美元的货物可以在今年内交付,剩余80%的订单将推迟至2024年。

那么,这些高端GPU到底都卖给了谁?产能为何出现瓶颈?老黄权威解答。

英伟达CEO黄仁勋主导的决策下,英伟达的A100和H100成为了AI界的香饽饽。H100甚至已经成为初创公司的资产之一,可用于抵押贷款。OpenAI、Meta等AI公司,以及亚马逊、微软等云计算巨头,私有云提供商CoreWeave和Lambda,以及其他希望炼制大模型的科技公司,对这些GPU的需求都十分巨大。

然而,这些GPU卖给谁,实际上取决于英伟达的黄仁勋。根据消息来源,考虑到H100的供应短缺,英伟达大部分的新卡都分配给了CoreWeave,而对于亚马逊和微软等老牌云计算公司则进行了限量供应。这也有可能是因为这些公司都在自主开发AI加速芯片,希望减少对英伟达的依赖,而黄仁勋则顺势配合。

黄仁勋在英伟达内部拥有对公司方方面面的掌控,甚至包括“审查销售代表为小型潜在客户准备的销售陈述”。大约40名高管直接向他报告,比Meta的小扎和微软的小纳加起来还多。在英伟达,黄仁勋几乎是每款产品的首席产品官。

不久前,有传闻称黄仁勋要求一些小型云计算公司提供客户名单,以了解GPU的最终使用者。外界分析认为,这将有助于英伟达更好地理解客户对其产品的需求,但也引发了有关英伟达是否会从这些信息中谋取额外利益的担忧。同时,也有观点认为,黄仁勋可能想要辨别真正在使用GPU的客户,与那些只是囤积卡片而未使用的客户。

英伟达和黄仁勋之所以有这么大的话语权,主要是因为高端GPU的供应和需求极度不平衡。根据GPU Utils网站的估算,H100的供应缺口高达43万张。根据已知信息和传闻,作者Clay Pascal估计,包括OpenAI、Meta等AI公司在内,近期需要的H100数量巨大。而大型公有云提供商如亚马逊、微软、谷歌和甲骨文等都需要H100来满足计算需求,私有云提供商CoreWeave和Lambda也需要大量的H100。加起来,市场对H100的需求高达43.2万张,而这还不包括金融公司和其他行业参与者在内。

然而,产能问题却阻碍了更多的H100供应。英伟达已经要求台积电调整生产计划,但仍未能填补供应缺口。英伟达DGX系统副总裁兼总经理Charlie Boyle表示,此次瓶颈不在晶圆制造上,而在于台积电的CoWoS封装技术产能。而台积电需要将产能用于为苹果生产下一代A17芯片,预计至少需要1.5年时间才能恢复正常封装工艺积压。

CoWoS封装技术是台积电的核心技术之一,

0