Oracle Machine Learning for R (OML4R) 让 R 统计编程语言和环境能够适用于企业和大数据。OML4R 专为涉及各种不同数据量的问题而设计,实现 R 与 Oracle 数据库相集成。
数据科学家和广大的 R 用户可以在利用 R 生态系统来支持 Oracle 数据库管理的数据。R 提供了一系列面向数据处理、图形、统计功能和机器学习算法的软件包。Oracle Machine Learning for R 通过三个主要领域扩展了 R 的功能:透明地访问和处理 R 中的数据库数据、数据库中机器学习算法以及利用嵌入式 R 执行简化部署。
Oracle Machine Learning 还支持"拖放式"图形用户界面,通过 Oracle Data Miner 与 Oracle SQL Developer 相集成,并且支持在用户创建的分析工作流程中执行用户定义的 R 函数。
透明度层 - 利用 R data.frame 代理对象,从而让数据保留为数据库表和视图。过载的 R 函数将 select R 功能转换为等效 SQL 以实现数据库内处理、并行性、可扩展性和安全性。数据科学家可以使用熟悉的 R 语法来处理保留在数据库中的数据库数据。利用 OREdplyr 软件包,其中提供了广受欢迎的开源 R dplyr 软件包的过载功能。
机器学习算法 - R 用户可以通过 R 语言来利用 Oracle 机器学习的数据库内并行算法库。用户可以使用熟悉的 R 公式语法来指定机器学习模型。算法支持分类、回归、异常检测、聚类、特征提取、时间序列和关联规则。
嵌入式 R 执行 - 在 Oracle 数据库中管理和调用用户定义的 R 函数以实现数据并行、任务并行和非并行执行,而且也可以使用第三方 R 包,例如来自 CRAN 信息库的 R 包。当数据科学家需要 R 生态系统中的技术来满足独特需求时,则可以利用 R 生态系统。
集成文本挖掘 - 数据库内算法接受来自表和视图的文本列,然后自动进行术语和主题提取。所提取的数据将与其他预测变量相结合来支持模型构建和数据评分。
分区模型 - 借助数据库内模型,用户可以自动创建模型集合,其中每一个模型要素均构建于用户指定的数据分区之上。利用单一集成模型来支持和简化评分。
注:为免疑义,本网页所用以下术语专指以下含义: