谷歌正迅速成为BFFNvidia的强大对手

2023-12-25 09:42:50深情的哈密瓜

谷歌最近推出了GeminiAI模型,并配备了最新版本的用于AI训练和推理的旗舰张量处理单元(TPU),这似乎是为了挑战Nvidia自己市场领先的GPU。

谷歌正迅速成为BFFNvidia的强大对手

TPUv5p——谷歌最强大的定制设计人工智能加速器——已被部署为该公司的“人工智能超级计算机”提供动力。这是一种专门为运行人工智能应用程序而构建的超级计算架构,而不是通常运行科学工作负载的超级计算机,因为TPU不适合于此。

最新版本的TPU每个Pod有8,960个芯片(构成系统),而v4中有4,096个芯片,并且就每个Pod的FLOP总可用性而言,其可扩展性是其四倍。这些新Pod提供4,800Gbps的吞吐量。新Pod还配备95GB高带宽内存(HBM),而TPUv4中则配备32GBHBMRAM。

与Nvidia提供GPU供其他公司购买不同,谷歌的定制TPU仍保留在内部,供其自己的产品和服务使用。谷歌的TPU长期以来一直用于为其Gmail、YouTube和Android等服务提供支持,最新版本也用于训练Gemini。

Google的v5pTPU训练大型语言模型的速度比TPUv4快2.8倍,性价比是TPUv4的2.1倍。尽管今年早些时候发布的中间版本TPUv5e是这三个版本中性价比最高的,但它仅比TPUv4快1.9倍,这使得TPUv5p成为最强大的。

它的功能甚至足以与Nvidia广受欢迎的H100GPU相媲美,后者是处理AI工作负载的最佳显卡之一。根据该公司自己的数据,该组件在训练工作负载方面比Nvidia的A100GPU快四倍。

与此同时,根据4月份发布的研究显示,谷歌TPUv4的速度预计比A100快1.2至1.7倍。因此,令人难以置信的粗略计算表明,TPUv5p的速度大约是A100的3.4到4.8倍,这使其与H100相当或优于H100,尽管在得出任何结论之前还需要更详细的基准测试。

推荐阅读

阅读排行