データ管理とは、安全性、効率性、費用対効果に優れた方法でデータを収集、保持、使用する実務です。データ管理の目標は、ポリシーと規制に準拠した範囲でデータを最適に使用できるように、人、組織、および接続された実体を支援し、組織に最大限の利益を実現する意思決定とアクションを実施できるようにすることにあります。価値の創出で組織が無形資産を多用する度合いが強くなるに伴い、堅牢なデータ管理戦略はこれまで以上に重要になっています。
組織でのデジタルデータの管理には、広範囲なタスク、ポリシー、手順、実務が関連します。データ管理業務の範囲は、次に挙げる機能を実現する手法などの要素を含め、多岐にわたります。
正式なデータ管理戦略が扱う対象は、ユーザーと管理者のアクティビティ、データ管理テクノロジの能力、各種規則の要求、およびデータから価値を得るための組織のニーズです。
現代のデジタル経済のにおいては、データは一種の資本であり、デジタル商品とデジタルサービスの生産における経済的要素です。自動車製造元を例に挙げると、必要な財務資本がなければ新しいモデルを製造できないこととまったく同様に、車載アルゴリズムに提供するデータがなければ自律運転の車は製造できません。データのこの新しい役割は、競争戦略だけでなく、コンピューティングの将来にも影響があります。
このような中核的でミッションクリティカルなデータの役割を考えると、組織の規模やタイプに関係なく、どのような組織でも強力な管理実務と堅牢な管理システムが不可欠です。
現代の組織には、多様であると同時に統合されたデータ層全体にわたり、データの効率的な管理方法を提供するデータ管理ソリューションが必要です。データ管理システムは、データ管理プラットフォーム上に構築され、データベース、データレイクとデータ・ウェアハウス、ビッグデータ管理システム、データ分析などを扱います。
これらすべての構成要素がまとまって「データユーティリティ」として機能し、組織がアプリに必要とするデータ管理機能、およびそれらのアプリから得られたデータを使用する分析とアルゴリズムを提供します。現在の各種ツールは、データベース管理者(DBA)が従来の管理タスクの多くを自動化するうえで効果的ですが、ほとんどのデータベース展開の規模と複雑さのため、いまだに人手の介入を必要とする場面が数多くあります。人手の介入が必要な場合は、誤りが発生するリスクがどうしても高くなります。手作業によるデータ管理の必要性を少なくすることは、新しいデータ管理技術である自律型データベースの重要な目標です。
ソフトウェアを継続的に提供するための最も重要なステップは、継続的インテグレーション(CI)です。CIは、開発者がコードの変更(通常は小規模な増分)を一元化されたソース・リポジトリにコミットする開発手法であり、自動化されたビルドとテストのセットを開始します。このリポジトリを使用すると、開発者はバグが本番環境に入る前に、バグを早期に自動的にキャプチャできます。継続的インテグレーション・パイプラインには通常、コードのコミットから基本的な自動リンティング/静的分析の実行、依存関係のキャプチャ、そして最後にソフトウェアのビルド、ビルドアーティファクト作成前のいくつかの基本的な単体テストの実行までの一連のステップが含まれます。Github、Gitlabなどのソースコード管理システムでは、統合されたWebhookにJenkinsなどのCIツールがサブスクライブして、コードのチェックイン後に毎回、ビルドとテストを自動的に開始できます。
データ管理プラットフォームは、組織規模の大量データを収集および分析するための基本的なシステムです。商用データ・プラットフォームには、データベース・ベンダーまたはサードパーティ・ベンダーが開発した管理用ソフトウェア・ツールが付属していることが普通です。これらのデータ管理ソリューションは、ITチームとDBAが次のような一般的なタスクを実行するうえで効果的です。
普及が進むクラウド・データベース・プラットフォームを使用すれば、優れた迅速性と費用対効果でデータ管理システムの規模を調整できます。このプラットフォームは部分的にサービスとしても利用できるので、より多くの節減が実現します。
クラウドに置いた自律型データベースでは、人工知能(AI)と機械学習を使用して、DBAが実行する多くのデータ管理タスクを自動化します。このようなタスクとして、データベースのバックアップの管理、セキュリティの確保、パフォーマンスのチューニングなどがあります。
自律運転データベースとも呼ばれる自律型データベースは、次のような重要な利点をデータ管理に提供します。
普及が進むクラウド・データ・プラットフォームを使用すれば、優れた迅速性と費用対効果でデータ管理システムの規模を調整できます。このプラットフォームは部分的にサービスとしても利用できるので、より多くの節減が実現します。
ある意味、ビッグデータというと単に大量のデータを指すように思われます。しかし、ビッグデータには、従来のデータよりも多くの形式をとり、高速で収集される特性があります。Facebookなどのソーシャル・メディア・ソースから毎日、毎分入ってくるすべてのデータを思い浮かべるとわかります。そのデータの量、多様性、速度は、ビジネスにとってきわめて価値のあるものですが、同時にその管理を著しく複雑にしている要因でもあります。
ビデオカメラ、ソーシャル・メディア、音声録音、Internet of Things(IoT)デバイスなど、さまざまなソースから集まるデータの急増に伴って、ビッグデータ管理システムが登場しています。これらのシステムは、次に挙げる3つの一般的な領域に特化しています。
ビッグデータを使用して、製品開発、予知保全、カスタマー・エクスペリエンス、セキュリティ、運用効率などを改善および加速している組織があります。ビッグデータが大きくなるにつれて、各種のビジネス機会も多くなります。
今日のデータ管理における課題のほとんどは、ビジネスの急速な変化とデータの急増に起因しています。組織が利用できるデータの多様性、速度、および量が絶えず拡大していることから、その拡大に追随できる、より効果的な管理ツールが求められています。このような課題として、主に次のものがあります。
データ・インサイトの不足 |
センサー、スマート・デバイス、ソーシャル・メディア、ビデオカメラなど、これで以上に多くのソースからデータが収集され、保存されています。しかし、どのようなデータがどこにあって、どのように使用するかがわからなければ、そのデータはどれも役に立ちません。データ管理ソリューションには、意味のあるインサイトをタイムリーに提供するために、規模とパフォーマンスが必要です。 |
データ管理のパフォーマンス・レベルを維持することが困難 |
組織が取得、保存、および使用するデータは絶えず増加しています。このように拡大する層全体にわたって最短の応答時間を維持するには、パフォーマンスの低下を招くことなく、データベースに対する質問のタイプを継続的に監視し、クエリの変化に応じてインデックスを変更する必要があります。 |
変化するデータ要件に対応するための課題 |
コンプライアンス規制は複雑で、複数の管轄権限にわたり、絶えず変化しています。各組織では、データを見直して新しい要件または変更された要件に適合するデータを特定する作業を容易に実施できる必要があります。特に、ますます厳格化する世界中のプライバシー規制に準拠できるように、個人を特定できる情報(PII)を検出、追跡、および監視する必要があります。 |
データを簡単に処理および変換する必要 |
データの収集と識別そのものからは何の価値も得られません。価値を創出するには、データを処理する必要があります。分析に必要な形態にデータを変換するために多大の時間と労力が必要であると、その分析が実行されることはありません。その結果、そのデータから得られるはずの価値を実現できなくなります。 |
データを常に効果的に保存する必要 |
新たなデータ管理の下では、データがさまざまなシステムに格納されます。このようなシステムとして、データ・ウェアハウスのほか、あらゆる形式のあらゆるデータを単一のリポジトリに格納する非構造化データレイクがあります。データ・サイエンティストは、元の形式のデータを、多彩な分析に使用できる形状、形式、モデルに迅速、容易に変換する方法を必要としています。 |
ITのアジリティとコストを継続的に最適化する需要 |
現在、企業は、クラウド・データ管理システムによって、データの保管と分析をオンプレミス環境、クラウド環境、またはハイブリッド環境から選択できます。IT企業は、ITアジリティを最大限に維持し、コストを削減するために、オンプレミス環境とクラウド環境の間の同一性レベルを評価する必要があります。 |
欧州連合によって制定され、2018年5月に施行された一般的なデータ保護規則(GDPR)では、個人データの管理と処理に関する7つの主要原則を規定しています。これらの原則では、個人データを扱う際の合法性、公平性、透明性、個人データの用途の制限、個人データ取り扱いの正確さ、個人データの保存に対する制限、個人データ取り扱いの整合性と機密性などを求めています。
GDPRとそれを踏襲したCalifornia Consumer Privacy Act(CCPA)などの各種法律によって、データ管理の様相が変化しています。これらの要件は、個人データとその使用方法の管理をその個人に帰する標準的なデータ保護法を実現するものです。要するに、組織がデータの取得時にインフォームド・コンセントを入手しなかった場合、データの使用や使用地域の管理が不十分である場合、データの消去や移植性の要件に準拠していない場合に、これらの法律は、現実の法的手段によって一般消費者をデータの利害関係者の立場に置きます。
データ管理の課題に対処するには、包括的で十分に検討された一連のベストプラクティスが必要です。具体的なベストプラクティスは、扱うデータの種類と業種によって異なりますが、組織が取り組まなければならない主なデータ管理の課題には、次のベストプラクティスで対処します。
データを特定する検出レイヤーを作成する: |
アナリストとデータ・サイエンティストは、組織のデータ層の最上位にある検出レイヤーを使用すれば、データを検索および参照してデータを有効利用できます。 |
データを効率的に再利用するデータサイエンス環境を開発する: |
データサイエンス環境は、可能な限り多くのデータ変換作業を自動化し、データモデルの作成と評価を合理化します。手作業によるデータの変換を不要にする各種ツールを使用すると、新しいモデルの仮説設定とテストを迅速に進めることができます。 |
拡張するデータ層全体にわたるパフォーマンス水準を自律型テクノロジーで維持する: |
自律型データ機能は、AIと機械学習を使用して、データベースクエリを継続的に監視し、クエリの変更に応じてインデックスを最適化します。これにより、データベースは迅速な応答時間を維持でき、時間の浪費となる手動のタスクからDBAやデータ・サイエンティストが解放されます。 |
検出機能を使用してコンプライアンス要件を十二分に把握する: |
新しいツールは、データ検出を使用してデータを見直し、複数の管轄権限にわたるコンプライアンスに準拠するために検出、追跡、監視を必要とする関連性の連鎖を特定します。コンプライアンスの要求が世界中で高くなるに伴い、リスク担当者とセキュリティ担当者にとって、この機能はますます重要になります。 |
コンバージド・データベースを使用していることを確認 |
コンバージド・データベースとは、すべての最新のデータ型と最新の開発モデルを1つの製品でネイティブにサポートするデータベースです。最適なコンバージド・データベースはグラフ、IoT、ブロックチェーン、機械学習など、さまざまなワークロードを実行できます。 |
データベース・プラットフォームがビジネスをサポートするためのパフォーマンス、規模、および可用性を実装していることを確認 |
データをまとめる目的は、データを分析して、さらに適切でタイムリーな意思決定を行うことです。企業は、スケーラブルな高パフォーマンスのデータベース・プラットフォームによって、高度な分析と機械学習で複数のソースからデータを迅速に分析できます。このため、さらに適切なビジネス上の意思決定を行うことができます。 |
共通のクエリレイヤーを使用して、複数の多様な形式のデータストレージを管理する: |
新しいテクノロジーにより、複数のデータ管理リポジトリが連携して機能するようになるので、リポジトリ同士の違いがなくなります。多くの種類のデータストレージにまたがる共通のクエリレイヤーにより、データ・サイエンティスト、アナリスト、アプリケーションは、データが格納されている場所の認識や、手動でデータを使用可能な形式に変換する作業を必要とせずにデータにアクセスできます。 |
データサイエンスは、科学的な手法、プロセス、アルゴリズム、システムを使用してデータから価値を引き出すための学際的な分野です。データ・サイエンティストは、統計、コンピューター・サイエンス、ビジネス知識などの幅広いスキルを合わせ持っています。これらのスキルを使用して、Web、スマートフォン、顧客、センサーなどのソースから収集したデータを分析します
データがビジネス資本として新しい役割を担っているため、企業はデジタル世界のスタートアップ企業と創造的破壊企業がすでに知っていることを発見しています。データは、トレンドを把握し、意思決定を行い、競合他社に先駆けて行動を起こすための貴重な資産です。バリュー・チェーンにおけるデータの新たな立ち位置は、この新しい資本から価値を引き出すためのより良い方法を積極的に模索する方向へ組織を導いています。
クラウド内の自律型戦略とスケーラブルな高パフォーマンスのデータベース・クラウド機能の利点など、最適なデータ管理の機能の詳細をご覧ください。
ご購入をお考えですか?
営業担当者に問い合わせる営業担当者とチャットアカウント/サブスクリプション、プロモーションの問題
チャットを開始テクニカルサポート、またはその他のサポートリクエスト
サポート・オプションを表示