技术 | 适用性 | 算法 |
分类  | 用于预测响应/无响应、高/中/低贡献客户、可能购买/不购买等特定结果的常用技术。 | 广义线性模型逻辑回归 — Oracle 数据库中使用的经典统计技术,支持高性能、可扩展、并行的实现(适用于所有 OAA ML 算法)。支持文本和事务数据(适用于几乎所有 OAA ML 算法) 朴素贝叶斯 — 快速、简单、普遍适用.利用数据库的计数速度。 支持向量机 — 新一代机器学习算法,支持文本和宽数据。 决策树 — 流行的 ML 算法,具有可解释性。提供人类可读的“规则。 |
回归  | 用于预测客户终身价值、房价、成品率等连续数值结果的技术。 | 广义线性模型多元回归 — 经典统计技术,但现在作为高性能、可扩展、并行的实现在 Oracle 数据库中使用。支持岭回归、特征创建和特征选择。支持文本和事务数据。 支持向量机 — 新一代机器学习算法,支持文本和宽数据。 |
属性重要性  | 根据与目标属性的关系强度对属性进行排列。用例包括查找与响应报价的客户最相关的因素、与健康患者最相关的因素。 | 最短描述长度 — 将每个属性视为目标类别的一个简单预测模型,并提供相对影响。 |
异常检测  | 根据偏离正常的程度,识别异常情况或可疑情况。常见的例子包括医疗保健欺诈、费用报告欺诈和税务合规。 | 单分类支持向量机 — 根据“正常情况”进行训练,然后标记异常情况。 |
集群  | 对探索数据和发现数据中的自然分组非常有效。集群中的成员之间与其他不同集群的成员相比更加具有类似的特征。常见的例子包括发现新客户细分和生命科学发现。 | 增强 K 均值 — 支持文本挖掘、分层集群、基于距离。 正交分区集群 — 分层集群、基于密度。 最大期望 — 在混合数据(密集和稀疏)数据挖掘问题中表现良好的集群技术。 |
关联  | 发现与频繁共存项目相关的规则,用于市场购物篮分析、交叉销售和根本原因分析。对产品捆绑销售、店内布局和缺陷分析非常有效。 | Apriori — 市场购物篮分析的行业标准。 |
特征选择和提取  | 用现有属性的线性组合生成新属性。适用于文本数据、潜在语义分析、数据压缩、数据分解和预测,以及模式识别。 | 非负矩阵分解 — 将原始数据映射到新的属性集 主成分分析 (PCA) — 创建表示所有属性的更少的新组合属性。 奇异向量分解 — 既定的特征提取方法,具有广泛的应用。 |