HeatWave 是一種記憶體內、大規模平行、混合分欄資料處理引擎。它會導入最先進的演算法執行分散式查詢處理的,可提供極高的效能。
HeatWave 可大量分割節點叢集的資料,供同時運用。這提供極佳的節點間擴展性。叢集內的每個節點與節點內的每個核心都可以同時處理分割的資料。HeatWave 具備智慧型查詢排程器,可重疊運算與網路通訊作業,實現數千核心的高擴充性。
HeatWave 的查詢處理已針對雲端商品伺服器最佳化。分割區的大小已經過最佳化,可容納基礎資源配置的快取。運算與通訊重疊已針對可用的網路頻寬最佳化。各種分析處理原始類型會使用基礎虛擬機器 (VM) 的硬體指示。HeatWave 也被設計為橫向擴展資料處理引擎,並針對物件儲存中的資料查詢進行最佳化。
Oracle HeatWave GenAI 透過資料庫內大型語言模型 (LLM),提供整合且安全的自動化生成式 AI、自動化且安全的資料庫內向量儲存、橫向擴展向量處理,並支援以自然語言進行情境式對話,即使不具備 AI 專長,您也能在不移動資料的情況下使用生成式 AI,而且也不用額外付費。
在所有 Oracle Cloud Infrastructure (OCI) 區域、OCI Dedicated Region、Oracle Alloy、Amazon Web Services (AWS) 和 Microsoft Azure 中使用內建 LLM,並在各個部署中獲得一致的結果和可預測的效能。由於無需佈建 GPU,因此可降低基礎架構成本。
在 OCI 上使用 HeatWave GenAI 時,透過 OCI Generative AI 服務從 Cohere 和 Meta 存取預先訓練的基礎模型;在 AWS 上使用 HeatWave GenAI 時,透過 Amazon Bedrock 存取預先訓練的基礎模型。
對儲存在 HeatWave 向量儲存區中的各種格式的 LLM 和專有文件執行檢索增強生成 (RAG),以獲得更準確且符合情境的相關答案,而無需將資料移至單獨的向量資料庫。
利用自動化管道來發現和提取 HeatWave Vector Store 中的專有文件,即使不具備 AI 專業知識的開發人員和分析師也可以輕鬆地使用向量儲存區。
向量處理以記憶體頻寬執行,可平行處理多達 512 個 HeatWave 叢集節點,有助於快速提供結果,同時降低準確性損失的可能性。
使用自然語言,透過物件儲存中的非結構化文件進行情境式對話;使用整合式 Lakehouse Navigator 引導 LLM 搜尋特定資料集,以降低成本,同時更快獲得更準確的結果。
HeatWave MySQL 是完全託管的資料庫服務,也是唯一基於 MySQL Enterprise Edition 建置的雲端服務,具有加密、資料遮罩、驗證和資料庫防火牆等進階安全功能。HeatWave 可將 MySQL 查詢效能提高幾個數量級,讓您能夠對 MySQL 中的交易資料進行即時分析,而無需將擷取、轉換及載入 (ETL) 複製到單獨的分析資料庫,從而避免了相關的複雜性、延遲、風險和成本。
當交易更新自動即時複製到 HeatWave 分析叢集時,分析查詢即可存取最新的資訊。執行分析查詢之前,不需要編列資料索引。您不僅可消除複雜、耗時且成本高昂的 ETL 流程,還可免去整合單獨分析資料庫的工作。
藉助 MySQL HeatWave Lakehouse,使用者能以各種檔案格式 (例如 CSV、Parquet、Avro、JSON) 查詢物件儲存中 0.5 PB 的資料,並從其他資料庫匯出檔案。查詢處理完全在 HeatWave 引擎中進行,因此客戶不僅能利用 HeatWave 執行與 MySQL 相容的工作負載,也能執行非 MySQL 工作負載。
客戶可以使用標準的 SQL 命令,查詢物件儲存中各種格式的資料、MySQL 資料庫中的交易資料,或上述兩種資料的組合。如 10 TB TPC-H 基準所示,查詢物件儲存中的資料,速度就和查詢資料庫一樣快。
在 HeatWave AutoML 的輔助下,客戶可以使用物件儲存、資料庫或二者的資料來自動建置、訓練、部署及解釋 ML 模型,而無須將資料移到其他 ML 雲端服務。
HeatWave 大量分割的架構可實現 HeatWave Lakehouse 的橫向擴展架構。查詢處理和資料管理作業 (例如載入/重新載入資料) 會隨資料大小調整。客戶可以使用 HeatWave Lakehouse 查詢物件儲存中 0.5 PB 的資料,而不需要複製到 MySQL 資料庫。HeatWave 叢集可擴充至 512 個節點。
HeatWave Autopilot 的自動佈建、自動查詢計畫改善和自動平行載入等功能已針對 HeatWave Lakehouse 強化,進一步減少資料庫管理的間接費用,同時提升效能。新的 HeatWave Autopilot 功能也適用於 HeatWave Lakehouse。
HeatWave AutoML 包含使用者在 HeatWave 內建置、訓練、部署及說明機器學習模型所需的一切功能,無需額外付費。
藉助 HeatWave 的資料庫內機器學習,客戶無需將資料移到不同的機器學習服務,即可輕鬆、安全地對儲存在 MySQL 和 HeatWave Lakehouse 物件儲存中的資料進行機器學習訓練、推論和解釋,藉此加速機器學習計畫、提高安全性並降低成本。
HeatWave AutoML 會自動化機器學習生命週期,包括演算法選擇、模型訓練的智慧型資料抽樣、功能選擇和超參數最佳化,可節省資料分析師和資料科學家大量的時間和精力。您可以自訂機器學習管線的層面,包括演算法選擇、功能選擇以及超參數最佳化。HeatWave AutoML 支援異常偵測、預測、分類、迴歸及推薦系統任務,對文字資料欄也適用。使用者可以針對非監督式異常偵測的結果提供意見回饋,並使用此有標記的資料協助改善後續預測。
HeatWave AutoML 推薦系統會同時考慮隱含回饋 (過往購買記錄、瀏覽行為等) 和明確回饋 (評分、按讚等),產生個人化的推薦。舉例來說,分析師能夠預測某位使用者會喜歡的項目、對特定項目有興趣的使用者,以及項目會獲得的評分。此外,也能夠在已知一個使用者的情況下,取得相似使用者清單;在已知一個特定項目的情況下,取得相似項目清單。
商業分析師可以透過互動式主控台,使用視覺化介面建置、訓練、執行及解釋 ML 模型,而無須使用 SQL 命令或任何編碼。主控台也可讓您輕鬆探索假設情況案例來評估業務假設,例如「如何在付費的社群媒體廣告中投資 30% 會影響營收和獲利?」
凡經 HeatWave AutoML 訓練的模型皆可說明。HeatWave AutoML 提供說明結果的預測,有助於組織符合法規、公平性、可重複性、因果關係和信任。
主題模型化可協助使用者瞭解文件中的關鍵主題,協助使用者探索大型文字資料集的見解,從而完成社交媒體資料的情感分析等工作。資料漂移偵測可偵測用於訓練的資料與新傳入資料之間的差異,協助分析師確定何時重新訓練模型。
程式開發人員和資料分析師可以使用熟悉的 SQL 命令建置機器學習模型,不需要學習新的工具和語言。此外,HeatWave AutoML 也與熱門的 Jupyter 和 Apache Zeppelin 等筆記本整合。
HeatWave Autopilot 提供工作負載感知、機器學習驅動的自動化。不須具備資料庫調整專業知識,也能改善效能和可擴充性,提高開發人員和 DBA 的生產力,並協助免除人為失誤。在實現大規模高效能查詢方面,HeatWave Autopilot 能夠處理許多非常具有挑戰性的重要工作,包括佈建、載入資料、執行查詢和故障處理。HeatWave MySQL 客戶可免費使用 HeatWave Autopilot。
HeatWave Autopilot 為 HeatWave 和 OLTP 提供眾多功能,包括:
即時彈性可以讓客戶增加或減少任意節點數目的 HeatWave 叢集大小,但不會造成任何停機時間或唯讀時間。
調整大小作業只需要幾分鐘,HeatWave 在此時間仍處於線上狀態,可供所有作業使用。調整大小之後,即會從物件儲存體下載資料、自動在所有可用的叢集節點之間重新達到平衡,然後立即提供查詢使用。因此,客戶即使在尖峰時間仍能享有始終如一的高效能,並可在適當時機縮減 HeatWave 叢集以降低成本,卻不會造成任何停機或唯讀時間。
從物件儲存體有效率地重新載入資料,客戶也可以暫停和繼續其 HeatWave 叢集,以降低成本。
客戶可以將 HeatWave 叢集擴展或縮減為任意數目的節點,它們不受其他雲端資料庫供應商提供之嚴格大小模型強制施行的過度佈建和高成本執行處理所限制。使用 HeatWave,客戶只需支付實際使用的資源。
您可以在 OCI、AWS 或 Azure 上部署 HeatWave。您可以將資料從內部部署 OLTP 應用程式複製到 HeatWave,以在雲端進行近乎即時的分析和處理向量資料。您也可以在 OCI Dedicated Region 内的企業資料中心使用 HeatWave。
AWS 上的 HeatWave 為 AWS 客戶提供原生體驗,主控台、控制層和資料層皆位於 AWS 中。