オラクルは、統計学者やデータ・アナリスト、データ・サイエンティストによる統計データ分析や高度な分析、高機能グラフの生成をサポートする言語および環境としてRを採用しています。企業とビッグ・データ分析のニーズに対応するにあたり、オラクルは次の4つの主要テクノロジーを通じてRの統合を提供します。
|
企業の場合、そのデータは恐らく、Oracleデータベースに格納されているでしょう。Oracleは、組織をサポートするために最善のソフトウェア製品(今ではエンジニアド・システムも)を提供するという世界的な評判によってお客様に選ばれています。Oracleデータベースは非常に優れたパフォーマンスとスケーラビリティで知られており、提供されるサポートも世界クラスです。
お客様のデータがすでにOracleデータベースに格納されているか、またはその予定である場合、パフォーマンスの高いデータベースのコンピューティング環境を利用してデータを分析できます。従来は、モデル構築という明確な理由から、独立した分析サーバーにデータを移動する方法が一般的でした。ビッグ・データから価値を引き出そうとする組織にとって、この方法はもはや必要でもスケーラブルでもありません。
Oracleデータベースは現在、パラレル実行およびデータベース内での分散アーキテクチャの直接実行を行う最先端アルゴリズムが複数搭載しているほか、R統計プログラミング言語のカスタム・アルゴリズムによって強化されています。高度な分析にOracleデータベースを利用すると、次のような利点が得られます。
Stubhub、dunnhumby、CERN OpenLab、Financiera Uno、Turkcellをはじめとする顧客企業が、Oracle Advanced Analyticsを利用することで、アプリケーションの拡張や分析アーキテクチャの簡素化、予測モデルの市場提供期間の短縮(数週間から数時間または数分)に成功しています。
オラクルは、幅広いOracle Applicationsと社内導入にOracle Advanced Analyticsを使用するなど、自社の高度な分析製品を活用しています。
オラクルは、高度な分析によって成果を出していただくために、お客様との緊密なやり取りによって、お客様の分析戦略に不可欠なプロセスとしてOracle Advanced Analyticsを統合します。これにより、お客様は高度な分析を迅速に本番環境に導入することができます。
オラクルの目標は、お客様がすべてのデータを活用してタイムリーにインサイトを得られるようにすることです。従来はデータベース外へのデータ抽出が必須であったワークロードをインプレース実行できるように、オラクルはデータベースの強化を継続的に行っています。その目的は、獲得できるインサイトと利用可能なデータの間にあるギャップを小さくすることです。なぜなら、あらゆるデータ移動は各要素の移行だけでなく待機時間を発生させ、コストは言うまでもなく、その後にデータのリコンシリエーションと管理を余儀なくさせるからです。
オラクルは、多数のデフォルトやヒューリスティックが標準提供されたGUIベースの分析機能を好むユーザーや、Rを使用したインタラクティブで定量的な分析を選ぶユーザーから、SQLを使用したモデルの運用化に重点を置くユーザーまで、あらゆる種類の企業ユーザーに対応することを目指しています。
オラクルは、データ・アナリストや統計学者、データ・サイエンティストに対して、広く使用されている急成長中の統計プログラミングを提供してサポートする必要性を認識しています。オラクルは、コンピュータを使用した統計と高度な分析の新たな事実上の標準としてのRを認めてこれを選びました。オラクルがRをサポートする方法は、少なくとも3つあります。
当然これ以外に、任意のCRANアルゴリズムを利用して、いくつかのデータ並列処理形式を利用してデータベース内処理を実行することも選択できます。
大手企業からの初で唯一のサポートされた商用Rディストリビューションとして、オラクルはOracle R Distributionをリリースしました。2012年、非構造化データ(または現時点では構造化されていないデータ)を管理するための新たなデータ管理方法がオープンソースで出現したことを認識したオラクルは、Hadoopに関するプロジェクトを開始しました。
データの格納場所の近くで分析を実施するという戦略に従って、オラクルはAdvanced Analytics機能をHadoop環境のHDFSにあるデータでも実行できるように拡張しました。Rはデータベースとまったく同じ方法でHadoopに統合されています。
データベースと非データベース環境の両方にデータが格納されているため、オラクルはデータの格納場所(Oracle Database、HDFS、Spark RDD)、計算の実行場所(データベース内またはHadoopクラスタ)、結果の保存場所(Oracle DatabaseまたはHDFS)に対するオプションを提供しています。ユーザーはRスクリプトを作成し、データベース環境とHadoop環境にまたがって利用することができます。
Rスクリプトやデータ、結果オブジェクトの保存場所として望ましいOracle Databaseは、リアルタイムのスコアリングとデプロイメントのプラットフォームとして使用できます。また、認可、ロール、権限に加えて監査、バックアップ、リカバリ、セキュリティ機能を備えたモデル作成環境を容易に作成できます。
オラクルはデータベース内とカスタムの両方のRアルゴリズムをサポートする共通インフラストラクチャを提供します。また、ビジネス・ユーザー向けの統合GUIを提供します。データベース内分析には、RベースのアクセスとGUIベースのアクセスが提供されています。オラクル戦略の大きな部分を占めるのは、サポートされる技術ポートフォリオにおいて機敏性を維持すること、つまりお客様のニーズに対して素早く反応することです。