谷歌正迅速成为BFFNvidia的强大对手

2023-12-25 09:42:50深情的哈密瓜

谷歌最近推出了GeminiAI模型，并配备了最新版本的用于AI训练和推理的旗舰张量处理单元(TPU)，这似乎是为了挑战Nvidia自己市场领先的GPU。

TPUv5p——谷歌最强大的定制设计人工智能加速器——已被部署为该公司的“人工智能超级计算机”提供动力。这是一种专门为运行人工智能应用程序而构建的超级计算架构，而不是通常运行科学工作负载的超级计算机，因为TPU不适合于此。

最新版本的TPU每个Pod有8,960个芯片(构成系统)，而v4中有4,096个芯片，并且就每个Pod的FLOP总可用性而言，其可扩展性是其四倍。这些新Pod提供4,800Gbps的吞吐量。新Pod还配备95GB高带宽内存(HBM)，而TPUv4中则配备32GBHBMRAM。

与Nvidia提供GPU供其他公司购买不同，谷歌的定制TPU仍保留在内部，供其自己的产品和服务使用。谷歌的TPU长期以来一直用于为其Gmail、YouTube和Android等服务提供支持，最新版本也用于训练Gemini。

Google的v5pTPU训练大型语言模型的速度比TPUv4快2.8倍，性价比是TPUv4的2.1倍。尽管今年早些时候发布的中间版本TPUv5e是这三个版本中性价比最高的，但它仅比TPUv4快1.9倍，这使得TPUv5p成为最强大的。

它的功能甚至足以与Nvidia广受欢迎的H100GPU相媲美，后者是处理AI工作负载的最佳显卡之一。根据该公司自己的数据，该组件在训练工作负载方面比Nvidia的A100GPU快四倍。

与此同时，根据4月份发布的研究显示，谷歌TPUv4的速度预计比A100快1.2至1.7倍。因此，令人难以置信的粗略计算表明，TPUv5p的速度大约是A100的3.4到4.8倍，这使其与H100相当或优于H100，尽管在得出任何结论之前还需要更详细的基准测试。

声明：本站所有作品图文均由用户自行上传分享，仅供网友学习交流。若您的权利被侵害，请联系我们