新型AI 超级计算机提供高达 131,072 个 NVIDIA GPU,帮助客户大规模构建、训练和推理 AI
甲骨文全球云大会,美国拉斯维加斯—2024年9月11日Oracle 宣布推出采用 NVIDIA Blackwell 平台的 Zettascale 云计算集群。 Oracle Cloud Infrastructure (OCI) 现在开始接收基于云技术的大型 AI 超级计算机的订单,可提供多达 131,072 个 NVIDIA Blackwell GPU。
甲骨文公司云基础设施执行副总裁 Mahesh Thiagarajan 表示:“我们拥有广泛的 AI 基础设施产品,为在云端运行高要求 AI 工作负载的客户提供支持。借助 Oracle Distributed Cloud,客户可以灵活地在不同位置部署云技术和 AI 服务,同时保留高级别的数据和 AI 主权。”
现在,OCI 开始接收云端大型 AI 超级计算机的订单,可搭载多达 131,072 个 NVIDIA Blackwell GPU,提供突破性的 2.4 zettaFLOPS 峰值性能。OCI Supercluster 包含了 OCI Compute Bare Metal、具有 ConnectX-7 NIC 和 ConnectX-8 SuperNICs 或 NVIDIA Quantum-2 InfiniBand 网络的超低延迟 RoCEv2 以及 HPC 存储选项。
OCI Superclusters 可由 NVIDIA H100 或 H200 Tensor Core GPU 或 NVIDIA Blackwell GPU 驱动的 OCI Compute 一起订购。配备 H100 GPU 的 OCI Superclusters 可支持多达 16,384 个 GPU,提供高达 65 ExaFLOPS的性能和 13 Pb/s 的聚合网络吞吐量。由 H200 GPU驱动的 OCI Superclusters 将于今年晚些时候推出,将扩展到 65,536 个 GPU,提供高达 260 ExaFLOPS 的性能和 52 Pb/s 的聚合网络吞吐量。搭载了 NVIDIA GB200 NVL72 液冷裸金属实例的 OCI Superclusters 将使用 NVLink 和 NVLink Switch,使多达 72 个 Blackwell GPU 能够在单个 NVLink 域中以 129.6 TB/s 的总带宽相互通信。NVIDIA Blackwell GPU 将于 2025 年上半年上市,配备了第五代 NVLink、NVLink Switch 和集群网络,可在单个集群中实现无缝 GPU-GPU 通信。
NVIDIA 超大规模和高性能计算副总裁 Ian Buck 表示:“随着企业、研究人员和国家竞相利用 AI 进行创新,获得强大的计算集群和 AI 软件至关重要。在广泛的 Oracle Distributed Cloud 上提供的 NVIDIA 全栈 AI 计算平台,可将以前所未有的规模提供 AI 计算能力,进而推动全球性的 AI 工作,帮助世界各地的组织加速研究、开发和部署。”
WideLabs 和 Zoom 等客户正在利用 OCI 具有强大安全性和主权控制的高性能 AI 基础设施。
WideLabs 是巴西的一家应用 AI 初创公司,目前正在 OCI 上训练巴西的大型 LLM — Amazonia IA。该公司开发了一款名为 bAIgrapher 的应用,可使用 LLM 根据从阿尔茨海默病患者收集的数据生成传记内容,帮助患者保留重要的记忆。
WideLabs 使用 Oracle Cloud São Paulo Region 运行 AI 工作负载,确保敏感数据保留在国家/地区范围内。这使 WideLabs 能够控制其 AI 技术的部署和运行位置,从而满足巴西 AI 主权要求。WideLabs 使用搭载了 NVIDIA H100 GPU 的 OCI AI 基础设施来训练其 LLM,同时也使用 Oracle Kubernetes Engine 在一个 OCI Supercluster 中预配、管理和运行由 GPU 加速的容器,该超级集群由 OCI Compute 与基于 OCI RMDA 的集群网络连接组成。
WideLabs 首席执行官 Nelson Leoni 表示:“OCI AI 基础设施为我们提供了高效训练和运行 LLM 的能力。随着我们在医疗卫生领域和其他关键领域持续创新,OCI 的规模和灵活性是不可或缺的。”
Zoom 是一个 AI 优先的协作平台,使用 OCI 为该公司免费的 AI 个人助手 Zoom AI Companion 提供推理。Zoom AI Companion 可帮助用户起草电子邮件和聊天消息,汇总会议和聊天记录,在与同事进行头脑风暴时生成想法等等。OCI 的数据和 AI 主权功能将帮助 Zoom 将客户数据保存在本地,并支持沙特阿拉伯的 AI 主权要求 — OCI 的解决方案一开始就是在沙特阿拉伯推出的。
Zoom AI 产品负责人 Bo Yan 表示:“Zoom AI Companion 为付费客户账户免费提供前沿生成式 AI 功能,帮助企业革新工作方式。借助 OCI 的 AI 推理功能,Zoom 能够以低延迟提供准确的结果,帮助用户实现无缝协作、轻松通信,同时提高生产力、效率和潜力。”
Oracle 在 Oracle Cloud 中提供集成的应用套件和具有安全性和自治能力的基础设施。如需了解更多关于 Oracle (NYSE: ORCL) 的信息,请访问 www.oracle.com/cn/。
甲骨文全球云大会是一个专为 Oracle 客户和合作伙伴而举办的活动,旨在让大家了解云技术的新创新、如何充分发挥AI 商业价值以及如何通过自动化提高生产力和效率。届时,您将有机会向构建和使用应用、云基础设施、数据库、开发人员工具和 AI 服务的专家和同行学习,了解他们如何利用这些解决方案应对各行各业复杂的业务挑战。欢迎您与我们一起培养新技能,并观看新功能的实况演示。立即访问 oracle.com/cloudworld 报名参加会议,或浏览 oracle.com/news and linkedin.com/company/oracle,持续关注我们的新闻和讨论话题。
以上内容旨在概述产品的总体发展方向。该内容仅供参考,不可纳入任何合同。该内容不构成提供任何资料、代码或功能的承诺,并且不应该作为制定购买决策的依据。此处所述有关 Oracle 产品的任何特性或功能的开发、发布、日程安排以及定价均由 Oracle Corporation 自行决定。
本文中有关 Oracle 未来计划、预期、观点和意向的陈述仅为“前瞻性陈述”,受重大风险和不确定因素的影响。许多因素都可能会影响 Oracle 的当前预期和实际结果,而且可能会导致实际结果出现重大差异。Oracle 提交给证券交易委员会 (SEC) 的申报文件中包含有关这些因素和其他影响 Oracle 业务的风险的讨论,其中包括 Oracle 在“风险因素”标题下给出的有关 10-K 表格和 10-Q 表格的最新报告。您可通过 SEC 网站或 Oracle 网站获得这些申报文件,网址为 oracle.com/investor。本文中的所有信息均为截至 2024 年 9 月 11 日的新信息,Oracle 不负责根据新信息或未来事件更新其中的任何陈述。
本文所述的许多产品和功能仍处于不同阶段,将分别在正式发布后开始提供。上述声明并非旨在构成,也不应理解为承诺或法律义务,所述的任何产品特性或功能的开发、发布和时间安排均由 NVIDIA 自行决定。NVIDIA 对于未能交付或延迟交付本文所述的任何产品、特性或功能不承担任何责任。
Oracle、Java、MySQL 和 NetSuite 是 Oracle Corporation 的注册商标。
其他公司和产品名称可能是与其关联的公司的商标。特性、定价、可用性和规格方面如有更改,恕不另行通知。
注:为免疑义,本网页所用以下术语专指以下含义: