手法 | 適用範囲 | アルゴリズム |
分類  | 反応あり/なし、顧客価値が高い/中程度/低い、購入見込みあり/なしなどの特定の結果を予測するためにもっともよく使用される手法。 | ロジスティック回帰 - 古典的な統計手法がOracle Database内で利用可能に。テキスト・データとトランザクション・データをサポート Naive Bayes - 高速かつ簡潔で、幅広く適用可能 サポート・ベクター・マシン - テキストと幅広いデータをサポートする次世代アルゴリズム ディシジョン・ツリー - 人間が読めるルールを提供する一般的アルゴリズム |
回帰  | 顧客生涯価値や住宅価値、プロセス歩留まり率など、継続的な数値結果を予測する手法。 | 重回帰 - 古典的な統計手法がOracle Database内で利用可能に。テキスト・データとトランザクション・データをサポート サポート・ベクター・マシン - テキストと幅広いデータをサポートする次世代アルゴリズム |
属性評価  | 対象属性との関係の強さに従って属性を評価。ユースケース例:提案に応じる顧客にもっとも関係する要因や、健康な患者にもっとも関係する要因の検出。 | 最小記述長 - 各属性をターゲット・クラスに対する簡潔な予測モデルとみなす |
異常検出  | 基準からの偏差に基づいて異常ケースや疑わしいケースを識別。一般的な例:医療不正、経費レポートの不正、税制遵守。 | 1クラス・サポート・ベクター・マシン - "正常"ケースを基準にした異常ケースのフラグ付け |
クラスタリング
 | データの調査と自然分類の検出に有効。クラスタ内の各メンバーは異なるクラスタのメンバーよりも類似性が高い。一般的な例:新規顧客セグメントの検出、ライフサイエンスの発見。 | 拡張K-Means - 距離ベースのテキスト・マイニング、階層型クラスタリングをサポート 直交パーティショニング・クラスタリング - 密度ベースの階層型クラスタリング 期待値最大化 - 混合データ(高/低密度)のデータ・マイニング問題で高い性能を発揮するクラスタリング手法 |
相関  | 頻繁に共起する要素に関連したルールの検出。マーケットバスケット分析、抱き合わせ販売、根本原因分析に使用。製品のバンドリング、店内配置、欠陥分析に有効。 | Apriori - マーケットバスケット分析に対する業界標準 |
特徴の選択と抽出  | 既存属性の線形結合として新規属性を生成。テキスト・データ、潜在的セマンティック分析、データ圧縮、データの分解と投影、パターン認識に適用可能。 | 非負行列因子分解 - 元データを新しい属性セットにマッピングする次世代アルゴリズム 主成分分析(PCA) - 全属性をより少数で表す新規複合属性を作成
特異値分解 - 幅広く適用できる確立した特徴抽出手法 |