Oracle Advanced Analytics 的机器学习算法 SQL 函数

Oracle Advanced Analytic 提供了大量数据库中机器学习算法并行实现,可以解决多种类型的业务问题。
有关每种算法、设置和 API 调用的详细信息,请参阅 Oracle Advanced Analytics 文档。   请参阅数据库 PL/SQL 包和类型参考中的 DBMS_DATA_MINING

技术 适用性 算法
分类
分类图像
用于预测响应/无响应、高/中/低贡献客户、可能购买/不购买等特定结果的常用技术。 广义线性模型逻辑回归 — Oracle 数据库中使用的经典统计技术,支持高性能、可扩展、并行的实现(适用于所有 OAA ML 算法)。支持文本和事务数据(适用于几乎所有 OAA ML 算法)

朴素贝叶斯 — 快速、简单、普遍适用.利用数据库的计数速度。

支持向量机 — 新一代机器学习算法,支持文本和宽数据。

决策树 — 流行的 ML 算法,具有可解释性。提供人类可读的“规则。
 

回归
回归图像
用于预测客户终身价值、房价、成品率等连续数值结果的技术。

广义线性模型多元回归 — 经典统计技术,但现在作为高性能、可扩展、并行的实现在 Oracle 数据库中使用。支持岭回归、特征创建和特征选择。支持文本和事务数据。

支持向量机 — 新一代机器学习算法,支持文本和宽数据。

属性重要性
属性重要性图像
根据与目标属性的关系强度对属性进行排列。用例包括查找与响应报价的客户最相关的因素、与健康患者最相关的因素。 最短描述长度 — 将每个属性视为目标类别的一个简单预测模型,并提供相对影响。
异常检测
异常检测图像
根据偏离正常的程度,识别异常情况或可疑情况。常见的例子包括医疗保健欺诈、费用报告欺诈和税务合规。 单分类支持向量机 — 根据“正常情况”进行训练,然后标记异常情况。
集群
集群图像
对探索数据和发现数据中的自然分组非常有效。集群中的成员之间与其他不同集群的成员相比更加具有类似的特征。常见的例子包括发现新客户细分和生命科学发现。 增强 K 均值 — 支持文本挖掘、分层集群、基于距离。

正交分区集群 — 分层集群、基于密度。

最大期望 在混合数据(密集和稀疏)数据挖掘问题中表现良好的集群技术。
关联
关联图像
发现与频繁共存项目相关的规则,用于市场购物篮分析、交叉销售和根本原因分析。对产品捆绑销售、店内布局和缺陷分析非常有效。 Apriori — 市场购物篮分析的行业标准。
特征选择和提取
特征提取图像
用现有属性的线性组合生成新属性。适用于文本数据、潜在语义分析、数据压缩、数据分解和预测,以及模式识别。 非负矩阵分解 — 将原始数据映射到新的属性集

主成分分析 (PCA) — 创建表示所有属性的更少的新组合属性。

奇异向量分解 — 既定的特征提取方法,具有广泛的应用。