AI Trends HUB

英特尔推出新一代AI芯片Gaudi 3，大模型训练推理能力强化50%

2024-04-10

英伟达的人工智能（AI）霸主地位面临新挑战，英特尔推出号称性能明显优于英伟达竞品的新一代AI芯片。

美东时间4月9日周二，在今年举办的客户与合作伙伴大会Intel Vision 2024期间，英特尔正式发布第三代英特尔AI加速器Gaudi 3。英特尔称，它将为企业应用生成式AI带来高性能、开放性和新选择。同时，英特尔还推出了一套全新的开放式可扩展系统、下一代产品和战略合作，加快生成式AI的应用。

去年发布新一代AI数据中心和个人电脑（PC）芯片新品时，英特尔CEO基辛格（Pat Gelsinger）就预告过，将推出用于深度学习和大型生成式AI模型的Gaudi 3。英特尔当时称，Gaudi 3的性能将优于英伟达的主打AI芯片H100。

本周二，基辛格在Intel Vision 2024大会上表示：“创新正在以前所未有的速度前进，这一切都是由芯片推动的——每家公司都在迅速成为AI公司。英特尔正在将AI带到整个企业的各个角落，从个人电脑（PC ）到数据中心再到边缘（计算）。我们（英特尔）最新的 Gaudi、至强（Xeon）和 Core 酷睿（Core）平台正在提供一套紧密结合的灵活解决方案，旨在满足客户和合作伙伴不断变化的需求，并充分利用未来的巨大机遇。”

Gaudi 3可将模型训练时间较H100缩短50%、推理吞吐量提高50%

英特尔介绍，Gaudi 3采用5纳米工艺制造，专为高效的大规模 AI 计算而设计，将为AI系统提供通过通用以太网标准连接的数以万计加速器支持。对于那些希望大规模配置生成式AI的企业来说，在大语言模型（LLM）和多模态模型的AI训练和推理方面，Gaudi 3可以实现性能和生产率的大飞跃。

英特尔称，对比前代，Gaudi 3可提供四倍的浮点格式BF16 AI计算能力，内存带宽提升1.5倍，服务于大规模系统扩展的网络带宽提升两倍。

对比英伟达的芯片H100，如果应用于7B和13B参数的Meta Llama2 模型以及175B参数的OpenAI GPT-3模型中，Gaudi 3预计可以让这些模型的训练时间平均缩短50%。

此外，应用于7B和70B参数的Llama以及180B参数的开源Falcon模型时，Gaudi 3的推理吞吐量预计将比H100平均高50%，推理功效平均高40%。而且，在较长的输入和输出序列上，Gaudi 3有更大的推理性能优势。

应用于7B和70B参数的Llama以及180B参数的Falcon模型时，Gaudi 3的推理速度相比英伟达H200提高30%。

英特尔称，Gaudi 3将在今年第三季度向客户供应，二季度向包括戴尔、HPE、联想和Supermicro在内的 OEM 厂商提供，但并未公布Gaudi 3的售价范围。

主管至强软件的英特尔副总裁 Das Kamhout称，英特尔预计，面对英伟达的最新产品，英特尔的Gaudi 3料将有很强的竞争力，“从我们具有竞争力的价格、我们独特的开放式集成片上网络来看，我们正在使用行业标准以太网。我们相信这是一个强大的产品。”

英特尔AI解决方案客户包括IBM等谷歌云将运用机密计算功能

在Intel Vision 2024期间，英特尔介绍其开放可扩展AI系统的战略，包括硬件、软件、框架和工具。

英特尔称，这种方式让AI领域的参与者能建立了广泛、开放的生态系统，从而提供满足企业特定生成式AI需求的解决方案。英特尔战略服务的客户包括设备制造商、数据库提供商、系统集成商、软件和服务提供商等，比如使用Gaudi芯片的NAVER、在其数据库应用第五代至强处理器的IBM、将与印度客户合作打造AI超级计算机的CtrlS Group。

英特尔还宣布与谷歌云、Thales 和 Cohesity 合作，这三家合作方将在其云实例中运用英特尔的机密计算功能。

1，欢迎转载，转载时请注明来源为 AITrendsHub。如需商业性转载或合作，请提前联系邮箱：aitrendshub@qq.com 。 2，本站内容仅供参考，不代表 AITrendsHub 的观点或立场。我们提供的AI资讯、数据与分析不构成任何投资或决策建议，请读者自行判断与承担风险。3、因平台信息海量，无法杜绝所有侵权行为，如有侵权烦请联系我们，以便及时删除 http://m.aitrendshub.net/nd.jsp?id=2390

写评论...