可查询对象存储中以各种文件格式(包括 CSV、Parquet、Avro 以及使用标准 SQL 语法从其他数据库导出的文件)保存的数据,并可将其与 MySQL 数据库中的事务数据组合使用。整个查询过程将在 HeatWave 引擎中完成,因此您可以将 HeatWave 用于非 MySQL 工作负载和与 MySQL 兼容的工作负载。加载到 HeatWave 集群中时,任何来源的数据都将自动转换为一个经过优化的内部格式。如此一来,查询对象存储数据的速度可以像查询数据库数据一样快。
查询结果将会写入对象存储,让用户可以轻松共享结果,以较低的成本将结果存储在对象存储中。同时,开发人员也能够将 HeatWave 用于 MapReduce 应用。
您可以使用 HeatWave 来查询对象存储中以 JSON 格式保存的半结构化数据,例如,使用对象存储中的 JSON 数据开发内容管理应用或实时仪表盘。HeatWave Lakehouse 中原生支持 JavaScript,因此您可以使用 JavaScript 来处理和查询对象存储中的数据。例如,可以使用 JavaScript 的丰富功能构建动态内容加载应用。
借助 HeatWave Vector Store,您可以上传和查询非结构化文档。
HeatWave 的高性能是横向扩展架构的结果,该架构支持通过大规模并行来预配集群、加载数据和处理多达 512 个节点的查询。集群中的每个 HeatWave 节点和节点中的每个核心都可以并行处理分区数据,包括并行扫描、连接、分组、聚合和 top-k 处理。这些算法旨在将计算时间与节点间数据通信重叠,有助于实现高可扩展性。
HeatWave Autopilot 为基于机器学习 (ML) 的 HeatWave 提供工作负载感知自动化。Oracle 为 HeatWave Lakehouse 增强了 HeatWave Autopilot 功能,例如自动预配、自动查询计划改进(从过去的查询执行中学习各种运行时统计信息,以改进未来查询的执行计划)和自动并行加载。HeatWave Lakehouse 的其他功能包括:
通过 HeatWave AutoML,您可以使用对象存储和/或数据库中的数据来构建、训练、部署和解释 ML 模型,无需将数据迁移到单独的 ML 云技术服务,更无需成为 ML 专家。HeatWave AutoML 能够推动机器学习管道自动化,包括算法选择、面向模型训练的智能数据采样、特征选择和超参数优化,为数据分析师节省大量时间和精力。HeatWave AutoML 支持异常检测、预测、分类、回归和推荐系统任务,甚至是文本列。您可以免费使用 HeatWave AutoML。
全面管理型服务可自动处理可用性管理、打补丁、升级和备份等耗时工作。在发生意外计算节点故障时,加载到 HeatWave 集群中的数据会自动恢复,无需从外部数据格式重新转换。
注:为免疑义,本网页所用以下术语专指以下含义: