Oracle Machine Learning for R

Oracle Machine Learning for R

Oracle Machine Learning for R (OML4R) 让 R 统计编程语言和环境能够适用于企业和大数据。OML4R 专为涉及各种不同数据量的问题而设计,实现 R 与 Oracle 数据库相集成。

更多信息

Machine Learning for R

数据科学家和广大的 R 用户可以在利用 R 生态系统来支持 Oracle 数据库管理的数据。R 提供了一系列面向数据处理、图形、统计功能和机器学习算法的软件包。Oracle Machine Learning for R 通过三个主要领域扩展了 R 的功能:透明地访问和处理 R 中的数据库数据、数据库中机器学习算法以及利用嵌入式 R 执行简化部署。

Oracle Machine Learning 还支持"拖放式"图形用户界面,通过 Oracle Data Miner 与 Oracle SQL Developer 相集成,并且支持在用户创建的分析工作流程中执行用户定义的 R 函数。

产品详情

全部展开 全部收起

功能概述

  • 快速开发和部署可直接在数据库数据上运行的 R 脚本
  • 通过自然 R API 利用可扩展的数据库中机器学习算法、数据准备、数据探索和统计分析
  • 利用基于 R 和 SQL API 的数据库管理 R 引擎,以数据和任务并行的方式执行用户定义的 R 函数
  • 结合使用数据库中 R 脚本信息库、R 对象数据存储区与用户访问权限
  • 在 Oracle 分析云、Oracle Data Visualization Desktop 和 Oracle Business Intelligence 仪表盘中包含基于 R 的结果
OML4R 图标

业务收益

  • 通过 R 接口利用 Oracle 数据库作为高性能计算环境
  • 利用可扩展的数据库中机器学习算法和统计功能
  • 在生产应用中运行 R 脚本并避免移植 R 代码或重塑部署基础设施
  • 尽可能减少数据移动
  • 使用 R 社区贡献的 R 包
  • 自动利用现有的数据库备份和恢复机制及过程
  • 通过 Oracle Big Data SQL 从数据湖触达数据
OML 用户角色

核心特性

透明度层 - 利用 R data.frame 代理对象,从而让数据保留为数据库表和视图。过载的 R 函数将 select R 功能转换为等效 SQL 以实现数据库内处理、并行性、可扩展性和安全性。数据科学家可以使用熟悉的 R 语法来处理保留在数据库中的数据库数据。利用 OREdplyr 软件包,其中提供了广受欢迎的开源 R dplyr 软件包的过载功能。

机器学习算法 - R 用户可以通过 R 语言来利用 Oracle 机器学习的数据库内并行算法库。用户可以使用熟悉的 R 公式语法来指定机器学习模型。算法支持分类、回归、异常检测、聚类、特征提取、时间序列和关联规则。 

嵌入式 R 执行 - 在 Oracle 数据库中管理和调用用户定义的 R 函数以实现数据并行、任务并行和非并行执行,而且也可以使用第三方 R 包,例如来自 CRAN 信息库的 R 包。当数据科学家需要 R 生态系统中的技术来满足独特需求时,则可以利用 R 生态系统。

OML4R 架构

更多特性

集成文本挖掘 - 数据库内算法接受来自表和视图的文本列,然后自动进行术语和主题提取。所提取的数据将与其他预测变量相结合来支持模型构建和数据评分。

分区模型 - 借助数据库内模型,用户可以自动创建模型集合,其中每一个模型要素均构建于用户指定的数据分区之上。利用单一集成模型来支持和简化评分。

R 的发展趋势
 
Oracle Machine Learning for R 快速入门

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。