HeatWave 功能

HeatWave

HeatWave 是一種記憶體內、大規模平行、混合分欄資料處理引擎。它會導入最先進的演算法執行分散式查詢處理的,可提供極高的效能。

專為大規模調整規模和效能打造的架構

HeatWave 可大量分割節點叢集的資料,供同時運用。這提供極佳的節點間擴展性。叢集內的每個節點與節點內的每個核心都可以同時處理分割的資料。HeatWave 具備智慧型查詢排程器,可重疊運算與網路通訊作業,實現數千核心的高擴充性。

針對雲端和物件儲存中的資料進行最佳化

HeatWave 的查詢處理已針對雲端商品伺服器最佳化。分割區的大小已經過最佳化,可容納基礎資源配置的快取。運算與通訊重疊已針對可用的網路頻寬最佳化。各種分析處理原始類型會使用基礎虛擬機器 (VM) 的硬體指示。HeatWave 也被設計為橫向擴展資料處理引擎,並針對物件儲存中的資料查詢進行最佳化。


HeatWave GenAI

Oracle HeatWave GenAI 透過資料庫內大型語言模型 (LLM),提供整合且安全的自動化生成式 AI、自動化且安全的資料庫內向量儲存、橫向擴展向量處理,並支援以自然語言進行情境式對話,即使不具備 AI 專長,您也能在不移動資料的情況下使用生成式 AI,而且也不用額外付費。

資料庫內 LLM

在所有 Oracle Cloud Infrastructure (OCI) 區域、OCI Dedicated Region、Oracle Alloy、Amazon Web Services (AWS) 和 Microsoft Azure 中使用內建 LLM,並在各個部署中獲得一致的結果和可預測的效能。由於無需佈建 GPU,因此可降低基礎架構成本。

與 OCI Generative AI 和 Amazon Bedrock 整合

在 OCI 上使用 HeatWave GenAI 時,透過 OCI Generative AI 服務從 Cohere 和 Meta 存取預先訓練的基礎模型;在 AWS 上使用 HeatWave GenAI 時,透過 Amazon Bedrock 存取預先訓練的基礎模型。

資料庫內向量儲存區

對儲存在 HeatWave 向量儲存區中的各種格式的 LLM 和專有文件執行檢索增強生成 (RAG),以獲得更準確且符合情境的相關答案,而無需將資料移至單獨的向量資料庫。

自動產生內嵌內容

利用自動化管道來發現和提取 HeatWave Vector Store 中的專有文件,即使不具備 AI 專業知識的開發人員和分析師也可以輕鬆地使用向量儲存區。

橫向擴展向量處理

向量處理以記憶體頻寬執行,可平行處理多達 512 個 HeatWave 叢集節點,有助於快速提供結果,同時降低準確性損失的可能性。

HeatWave Chat

使用自然語言,透過物件儲存中的非結構化文件進行情境式對話;使用整合式 Lakehouse Navigator 引導 LLM 搜尋特定資料集,以降低成本,同時更快獲得更準確的結果。

深入瞭解 HeatWave GenAI


HeatWave MySQL

HeatWave MySQL 是完全託管的資料庫服務,也是唯一基於 MySQL Enterprise Edition 建置的雲端服務,具有加密、資料遮罩、驗證和資料庫防火牆等進階安全功能。HeatWave 可將 MySQL 查詢效能提高幾個數量級,讓您能夠對 MySQL 中的交易資料進行即時分析,而無需將擷取、轉換及載入 (ETL) 複製到單獨的分析資料庫,從而避免了相關的複雜性、延遲、風險和成本。

無需 ETL 的即時分析

當交易更新自動即時複製到 HeatWave 分析叢集時,分析查詢即可存取最新的資訊。執行分析查詢之前,不需要編列資料索引。您不僅可消除複雜、耗時且成本高昂的 ETL 流程,還可免去整合單獨分析資料庫的工作。

進一步瞭解 HeatWave MySQL


HeatWave Lakehouse

藉助 MySQL HeatWave Lakehouse,使用者能以各種檔案格式 (例如 CSV、Parquet、Avro、JSON) 查詢物件儲存中 0.5 PB 的資料,並從其他資料庫匯出檔案。查詢處理完全在 HeatWave 引擎中進行,因此客戶不僅能利用 HeatWave 執行與 MySQL 相容的工作負載,也能執行非 MySQL 工作負載。

對所有資料進行快速資料湖倉儲分析和機器學習

客戶可以使用標準的 SQL 命令,查詢物件儲存中各種格式的資料、MySQL 資料庫中的交易資料,或上述兩種資料的組合。如 10 TB TPC-H 基準所示,查詢物件儲存中的資料,速度就和查詢資料庫一樣快。

在 HeatWave AutoML 的輔助下,客戶可以使用物件儲存、資料庫或二者的資料來自動建置、訓練、部署及解釋 ML 模型,而無須將資料移到其他 ML 雲端服務。

資料管理與查詢處理的橫向擴展架構

HeatWave 大量分割的架構可實現 HeatWave Lakehouse 的橫向擴展架構。查詢處理和資料管理作業 (例如載入/重新載入資料) 會隨資料大小調整。客戶可以使用 HeatWave Lakehouse 查詢物件儲存中 0.5 PB 的資料,而不需要複製到 MySQL 資料庫。HeatWave 叢集可擴充至 512 個節點。

利用機器學習驅動的自動化提升效能並節省時間

HeatWave Autopilot 的自動佈建、自動查詢計畫改善和自動平行載入等功能已針對 HeatWave Lakehouse 強化,進一步減少資料庫管理的間接費用,同時提升效能。新的 HeatWave Autopilot 功能也適用於 HeatWave Lakehouse。

  • 自動綱要推論會為所有支援的檔案類型 (包括 CSV) 自動推論檔案資料對應的相應綱要定義。因此,客戶不需要手動定義和更新檔案的綱要對應,從而節省時間和精力。
  • 調適型資料抽樣對物件儲存中的檔案進行智慧抽樣,以取得 HeatWave Autopilot 用於自動化預測的資訊。HeatWave Autopilot 使用調適型資料抽樣,以進行掃描並做出預測,例如在不到 1 分鐘的時間內對 400 TB 的檔案進行綱要對應。
  • 調適型資料流程可讓 HeatWave Lakehouse 動態適應任何區域中的基底物件儲存區效能,以提升整體效能、性價比和可用性。

深入瞭解 HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML 包含使用者在 HeatWave 內建置、訓練、部署及說明機器學習模型所需的一切功能,無需額外付費。

不需要獨立的機器學習服務

藉助 HeatWave 的資料庫內機器學習,客戶無需將資料移到不同的機器學習服務,即可輕鬆、安全地對儲存在 MySQL 和 HeatWave Lakehouse 物件儲存中的資料進行機器學習訓練、推論和解釋,藉此加速機器學習計畫、提高安全性並降低成本。

機器學習生命週期自動化可節省時間和精力

HeatWave AutoML 會自動化機器學習生命週期,包括演算法選擇、模型訓練的智慧型資料抽樣、功能選擇和超參數最佳化,可節省資料分析師和資料科學家大量的時間和精力。您可以自訂機器學習管線的層面,包括演算法選擇、功能選擇以及超參數最佳化。HeatWave AutoML 支援異常偵測、預測、分類、迴歸及推薦系統任務,對文字資料欄也適用。使用者可以針對非監督式異常偵測的結果提供意見回饋,並使用此有標記的資料協助改善後續預測。

提供個人化推薦的推薦系統

HeatWave AutoML 推薦系統會同時考慮隱含回饋 (過往購買記錄、瀏覽行為等) 和明確回饋 (評分、按讚等),產生個人化的推薦。舉例來說,分析師能夠預測某位使用者會喜歡的項目、對特定項目有興趣的使用者,以及項目會獲得的評分。此外,也能夠在已知一個使用者的情況下,取得相似使用者清單;在已知一個特定項目的情況下,取得相似項目清單。

互動式 HeatWave AutoML 主控台

商業分析師可以透過互動式主控台,使用視覺化介面建置、訓練、執行及解釋 ML 模型,而無須使用 SQL 命令或任何編碼。主控台也可讓您輕鬆探索假設情況案例來評估業務假設,例如「如何在付費的社群媒體廣告中投資 30% 會影響營收和獲利?」

可說明的 ML 模型

凡經 HeatWave AutoML 訓練的模型皆可說明。HeatWave AutoML 提供說明結果的預測,有助於組織符合法規、公平性、可重複性、因果關係和信任。

主題模型化和資料漂移偵測

主題模型化可協助使用者瞭解文件中的關鍵主題,協助使用者探索大型文字資料集的見解,從而完成社交媒體資料的情感分析等工作。資料漂移偵測可偵測用於訓練的資料與新傳入資料之間的差異,協助分析師確定何時重新訓練模型。

使用最新的技能

程式開發人員和資料分析師可以使用熟悉的 SQL 命令建置機器學習模型,不需要學習新的工具和語言。此外,HeatWave AutoML 也與熱門的 Jupyter 和 Apache Zeppelin 等筆記本整合。


HeatWave Autopilot

HeatWave Autopilot 提供工作負載感知、機器學習驅動的自動化。不須具備資料庫調整專業知識,也能改善效能和可擴充性,提高開發人員和 DBA 的生產力,並協助免除人為失誤。在實現大規模高效能查詢方面,HeatWave Autopilot 能夠處理許多非常具有挑戰性的重要工作,包括佈建、載入資料、執行查詢和故障處理。HeatWave MySQL 客戶可免費使用 HeatWave Autopilot。

HeatWave Autopilot 為 HeatWave 和 OLTP 提供眾多功能,包括:

  • 自動佈建會透過調適型抽樣需要分析的表格資料,預測執行工作負載所需的 HeatWave 節點數目。這表示程式開發人員和 DBA 不再需要手動預估叢集的最佳大小。
  • 自動執行緒集區處理可讓資料庫服務為指定的硬體組態處理更多交易,為線上交易處理 (OLTP) 工作負載提供較高的生產量,並防止高層次的交易和並行處理生產量降低。
  • 自動形塑預測功能會持續監控線上交易處理 (OLTP) 工作負載 (包括輸送量和緩衝集區點擊率),提供任何指定時間的正確運算資源配置建議,讓客戶持續享有最佳性價比。
  • 自動編碼會將查詢納入考量,決定載入 HeatWave 之資料欄的最佳表示法。此最佳表示法會提供最佳查詢效能,並將叢集大小降到最低,以將成本降到最低。
  • 自動查詢計畫改善會從執行查詢中學習各種統計資料,改善未來查詢的執行計畫。使系統效能隨執行的查詢增多而改善。
  • 調適型查詢最佳化使用多種統計資料,在查詢執行開始後調整資料結構和系統資源;亦即根據執行時期的實際資料分佈,獨立最佳化每個節點的查詢執行方式。特別查詢的效能可藉此提升 25%。
  • 自動放置資料可預測應分割記憶體中哪份表格的資料欄,以獲得最佳的查詢效能。它也會使用新的資料欄建議,預測查詢效能的預期收益。這會將節點間的資料移動降至最低,因為操作人員手動選取資料欄時的選擇,可能不是那麼盡如人意。
  • 自動壓縮會決定每個資料欄的最佳壓縮演算法,透過更快速的資料壓縮和解壓縮,提升載入和查詢效能。客戶可以藉由減少記憶體使用量,降低多達 25% 的成本。
  • Indexing 使用機器學習根據個別應用程式工作負載進行預測,自動判斷客戶應該從表格建立或刪除的索引,以最佳化 OLTP 生產量。為 OLTP 工作負載建立最佳索引、在工作負載發展期間維護這些索引都相當耗時,而此功能可為客戶省去這些任務。

即時彈性

即時彈性可以讓客戶增加或減少任意節點數目的 HeatWave 叢集大小,但不會造成任何停機時間或唯讀時間。

即使在尖峰時段也能保持始終如一的高效能及降低成本,無須停機

調整大小作業只需要幾分鐘,HeatWave 在此時間仍處於線上狀態,可供所有作業使用。調整大小之後,即會從物件儲存體下載資料、自動在所有可用的叢集節點之間重新達到平衡,然後立即提供查詢使用。因此,客戶即使在尖峰時間仍能享有始終如一的高效能,並可在適當時機縮減 HeatWave 叢集以降低成本,卻不會造成任何停機或唯讀時間。

從物件儲存體有效率地重新載入資料,客戶也可以暫停和繼續其 HeatWave 叢集,以降低成本。

沒有過度佈建的執行處理

客戶可以將 HeatWave 叢集擴展或縮減為任意數目的節點,它們不受其他雲端資料庫供應商提供之嚴格大小模型強制施行的過度佈建和高成本執行處理所限制。使用 HeatWave,客戶只需支付實際使用的資源。


適用於公有雲和您的資料中心

您可以在 OCI、AWS 或 Azure 上部署 HeatWave。您可以將資料從內部部署 OLTP 應用程式複製到 HeatWave,以在雲端進行近乎即時的分析和處理向量資料。您也可以在 OCI Dedicated Region 内的企業資料中心使用 HeatWave。

AWS 上的 HeatWave 為 AWS 客戶提供原生體驗,主控台、控制層和資料層皆位於 AWS 中。