Kubernetes Engine (OKE)

大規模簡化企業級 Kubernetes 的作業。透過自動擴展、修補和升級,輕鬆部署和管理資源密集型工作負載,例如 AI。

Oracle Cloud Infrastructure:Kubernetes 的性價比領導者

CIO 雜誌承認 OCI 在提供尖端 Kubernetes 解決方案方面的專業知識,支援可擴充且高效率的應用程式開發。

為何選擇 OKE?

  • 價格績效

    OKE 是所有超大規模用戶 (尤其是無伺服器) 中最低成本的 Kubernetes 服務。

  • 自動縮放

    OKE 會根據需求自動調整運算資源,進而降低成本。

  • 效率

    GPU 可以 很少見,但 OKE 工作排程也可讓您輕鬆地將資源使用率最大化。

  • 可攜性

    OKE 在雲端和內部部署均一致,可移植性並避免供應商鎖定。

  • 簡單性

    OKE 可減少管理 Kubernetes 基礎架構複雜性所需的時間和成本。

  • 可靠性

    自動升級和安全修補提高了控制層和工作節點的可靠性。

OKE 使用案例

OKE 支援 OCI AI 服務

Kubernetes 是部署 AI 工作負載的首選平台。OKE 支援 Oracle Cloud Infrastructure (OCI) AI 服務。

AI 模型建立

– AI 專案的初始建構階段涉及定義問題並準備資料以建立模型。

– Kubernetes 叢集可藉由授予昂貴且通常有限 GPU 資源的共用存取權,同時提供安全且集中管理的環境,大幅提升效率。

– 與 Kubernetes 相關的開源專案 Kubeflow 提供了完善的架構,可簡化模型的建置、訓練及部署。

建立 AI 模型的 OKE

OKE 建立在 OCI 之上,提供專為 AI/ML 工作負載設計的完整高效能基礎架構堆疊,例如:

– 全系列 NVIDIA GPU,包括 H100、A100、A10 等。

– 超快速的 RDMA 網絡

使用 OKE 自行管理節點,您可以在 Kubernetes 叢集上執行 AI/ML 建置工作負載。

OKE 支援 OCI AI 服務

Kubernetes 是部署 AI 工作負載的首選平台。OKE 支援 OCI AI 服務。

AI 模型訓練

– 在模型訓練中,資料科學家選擇一種演算法,並使用準備的資料啟動訓練工作。此階段需要精密的排程系統,以有效率的方式處理工作。

– Kubernetes 專案 (例如 Volcano 和 Kueue) 可協助處理這類需求,並有效運用運算資源。

– 大型分散式訓練需要叢集中的低延遲內部節點通訊。這裡需要具有遠端直接記憶體存取 (RDMA) 的特殊超快速網路。它可以直接將資料移入或移出應用程式的記憶體,略過 CPU 以減少延遲。

適用於 AI 模型訓練的 OKE

OKE 建立在 OCI 之上,提供專為 AI/ML 工作負載設計的完整高效能基礎架構堆疊,例如:

– 全系列 NVIDIA GPU,包括 H100、A100、A10 等。

– 低延遲、超高效能的 RDMA 網路

使用 OKE 自行管理節點,您可以在 Kubernetes 叢集上執行 AI/ML 訓練。

OKE 支援 OCI AI 服務

Kubernetes 是部署 AI 工作負載的首選平台。OKE 支援 OCI AI 服務。

AI 模型推論 (服務)

– AI 模型推論是 Kubernetes 真正令人驚嘆的地方。Kubernetes 可根據需求自動增加或減少推論 pod 的數量,確保高效運用資源。

– Kubernetes 提供複雜的資源管理,包括指定容器 CPU 和記憶體限制的能力。

AI 模型推論的 OKE

OKE 的核心具有彈性設計,可運用 Kubernetes 的內建 Pod 自動調整功能,根據使用狀況調整工作節點規模。工作節點可以分散至多個容錯和 (或) 可用性網域,以提供高可用性。

OKE 虛擬節點提供無伺服器 Kubernetes 體驗。他們只需要在 Pod 層級進行擴展,無須調整工作節點規模。由於服務費僅以使用中的 Pod 為基礎,因此能夠更快速地調整規模和更經濟的管理。

虛擬節點非常適合推論工作負載,而且可以使用 Arm 處理器,這對於 AI 推論來說變得更具吸引力,尤其當 GPU 供應短暫時。

現有應用程式可以藉由移轉至 OCI 和 OKE 而受益

OKE 可降低總持有成本,並縮短上市時間。

OKE 以下列方式大規模簡化作業:

  • 提升與移轉;無需重新架構
  • 透過自動化降低作業負擔
  • 節省基礎架構管理時間
  • 提高資源利用率和效率
  • 提高靈活度、靈活性、正常運作時間和彈性
  • 降低合規風險並增強安全性

相較於單體式應用程式,微服務提供許多優勢

使用以 OKE 為中心的微服務架構,讓您的應用程式經得起未來的考驗。

  • 架構現代化
  • 加快創新速度
  • 部署自動化
  • 平行開發
  • 更容易擴展
  • 更高的可靠性
  • 更大的彈性
  • 更高的靈活性

「許多 OCI AI 服務均在 Oracle 託管的 Kubernetes 服務 OCI Kubernetes 引擎 (OKE) 上執行。事實上,我們的工程團隊僅僅將平台切換到 OKE,就讓 OCI Vision 的效能提升了 10 倍,表現真的非常驚人。」

Jun Qian

Oracle Cloud Infrastructure 的 OCI AI 服務副總裁

客戶運用 OCI 上的雲端原生服務進行創新

探索更多客戶案例

開始使用 Kubernetes Engine

  • 使用 OKE 受管理節點部署簡單的容器化 App

    部署封裝為 Docker 容器的簡單微服務,並透過通用 API 進行通訊。


  • 部署含有虛擬節點的 Kubernetes 叢集

    探索使用提供的 Terraform 自動化和參照架構部署無伺服器虛擬節點集區的最佳做法。


  • 探索可最佳化 Kubernetes 資源的模式

    瞭解 Tryg Insurance 如何透過動態授權降低 50% 的費用。


2024 年 9 月 10 日

使用 OCI Kubernetes Engine (OKE) 附加元件簡化作業

Mickey Boxell,產品管理

OKE 附加元件提供可將叢集作業軟體管理卸載至 Oracle 的機會。他們還提供自訂或完全退出預設 Kubernetes 作業軟體的彈性,以帶來同等的軟體。我們很高興能分享另外四個附加元件的發行版本:Kubernetes Cluster Autoscaler、Istio 服務網格、OCI 原生輸入控制器和 Kubernetes Metrics Server,並支援新的組態引數,以更有效地控制部署到叢集的附加元件。

閱讀完整文章

相關 Kubernetes 產品

登錄檔

使用容器映像檔的安全、標準式服務

函數

以事件和 API 驅動的無伺服器平台

DevOps CI/CD

自動化跨組建、測試和部署的應用程式交付

資源管理員

Terraform 型雲端基礎架構自動化

開始使用 OKE

Oracle Cloud 免費層

獲得 CI/CD 工具、受管理 Terraform、遙測和其他工具的 30 天存取權。

Architecture Center

探索可部署的參考架構和解決方案手冊。

Oracle Cloud Native 服務

使用 Kubernetes、Docker、無伺服器、API 等功能強化應用程式開發。

聯絡我們

如果您有銷售、支援和其他問題,請與我們的同事聯繫。