データドリブン・データ活用・RPA（１０） - データ整理専門（機密情報・個人情報から通常データまで）

産業用データパイプライン：現場データ統合ソリューションの機能評価とデータ活用メリット

このソリューションは、製造現場で生成されるデータをリアルタイムで統合・活用するための産業用データパイプライン基盤として機能します。工場で使用される制御システムやPLC、SCADA、OPC、各種センサーなど、多様なOT（Operational Technology）データソースから、450種類以上のインターフェースを通じてデータを効率的に収集する能力は、データ収集の網羅性の高さをデータコンサルタントの視点から評価できます。収集されたデータは独自の圧縮技術を用いて時系列に整理・統合され、これはデータストレージおよび分析効率を最適化する高度なデータ処理と言えます。統合されたデータは、ITネットワーク内のERPやその他の基幹システムと連携するゲートウェイとして機能し、OTデータとITデータのシームレスな統合（OT/ITコンバージェンス）を実現するためのデータ連携ハブとしての役割を果たします。これにより、現場で取得したリアルタイムデータを研究開発部門、生産管理者、さらには経営層にまで共有することが可能になります。このデータ共有環境は、設備管理や稼働効率のデータに基づいた改善、予知保全といった現場レベルでのデータ駆動型最適化に加え、全社的な意思決定の迅速化や戦略立案における経営層によるリアルタイムデータ分析による課題解決にも活用できるポテンシャルを秘めています。

社内ポータルにおけるデータ利用効率の課題
企業の規模拡大に伴い、社内ポータルを活用するケースが多く見られます。その目的は、情報の一元管理、情報の周知や共有の効率化、業務効率の向上、社員や部署間のコミュニケーションなど、データ活用に関わる様々な側面を含みます。しかし、利用者が増加し情報流通データ量が爆発的に増加してしまうことで、情報フィルタリング機能の不足に起因するデータのノイズが増加し、利用者が真に必要な情報データを見つけるのに時間がかかってしまうといったデータ利用効率の低下が発生するケースが散見されます。また、ポータルのナビゲーション構造が複雑化し、データ構造やUI設計がユーザーのデータ探索行動パターンに適応していないことから、直感的でないインターフェースにより使いづらさを感じてしまうといった課題も挙げられます。このような状況は、情報検索ログ、ポータル利用率データ、ユーザー行動データなどの分析から明らかになるデータ利用の非効率性を示しており、社内ポータルの本来の目的が達成できていない現状を示唆しています。

社内ポータルパーソナライズ化：ユーザーデータ分析に基づく情報提供最適化
このような社内ポータルにおけるデータ利用効率の課題に対処するためには、ポータルのパーソナライズ化が有効なアプローチと考えられます。パーソナライズ化とは、利用者一人ひとりの閲覧履歴データ、関心領域データ、所属部署データ、役割データなどを分析し、その分析結果に基づいて最適化された情報データをレコメンデーションシステムを通じて提供することを指します。これにより、必要な情報データへのアクセスにかかる時間をデータとして短縮し、利便性や効率性の向上が見込めます。また、ユーザー行動データ分析に基づいたデータ表示の最適化により、関心のある情報やツールを簡単に見つけることができ、業務遂行におけるデータ探索関連のストレスを軽減することができます。さらに、組織構造データと連携し、各部門やチーム単位でのデータ共有範囲のパーソナライズ化を駆使することで、関連性の高いデータへのアクセスが容易になり、組織全体のデータ連携が強化され、全体的な業務効率と生産性を向上させることが期待できます。

建設業におけるデータ共有・管理の困難性：データドリブン志向による課題解決への示唆
組織を超えてさまざまな関係者（建設会社、協力会社、設計事務所など）が流動的に交わる建設現場では、統一された情報を関係者間で満遍なく行き渡らせることが難しいという、データ共有・管理に関する特有の課題が存在します。これは、各関係者が異なるシステムやプロセスでデータを管理していることに起因することが多く、データ統合の困難性を伴います。正確で統一された情報データがリアルタイムで共有されないことは、工期管理データや費用管理データに大きな影響を及ぼし、プロジェクト全体のデータ精度と効率性を損なう深刻なリスクとなりかねません。データドリブン志向でこれらの課題解決を目指すアプローチは、建設現場で発生する多様なデータを統合し、一元管理されたデータ基盤に基づいて関係者間で正確な情報を共有・分析することで、プロジェクト管理におけるデータに基づく意思決定を強化し、これらの課題に対処する可能性を示唆しています。

データ利活用の戦略的位置づけ：クラウド・AI時代におけるデータ資産活用の中核

クラウド技術やAIが急速に進化する現代において、組織内外で生成されるデータの量、種類、および流通速度は爆発的に増加しています。このようなデータ環境の変化を背景に、データを効果的に利活用することは、事業の変革や新たな価値創出のためのデータ資産活用戦略の中核となっています。データを包括的に利活用するためには、まずは社内外に散在する多様なデータソースを連携させ、データ統合基盤を構築することが第一歩となります。

データ連携領域における課題の構造分析
データ連携領域における課題は、データコンサルタントおよびデータアナリストの視点から、主に以下の3つの構造に分類・分析できます。

データ戦略の策定と評価の課題: データ利活用が具体的なビジネス目標にどのように貢献するかをデータに基づき明確に定義し、データ基盤投資の優先順位付けやROIを評価するといった、中長期的なデータ戦略の策定と推進に関する課題。
データ統合アーキテクチャと技術実装の課題: 既存システムのデータ構造、プロトコル、APIの多様性に対応した最適なデータ連携技術の選択、スケーラブルなデータ統合アーキテクチャの設計、およびデータパイプラインの安定運用に関する技術的な課題。
データプロセスと組織運用の課題: データ連携によって変化する業務プロセス（データ入力、承認、利用など）をデータフローの観点から分析し、効率化とデータ品質向上を図るためのプロセス設計、およびデータ活用を推進するための組織体制やデータガバナンスに関する運用上の課題。
最新のデータ連携トレンドと企業間データ連携の取り組み
（※元文章にある最新のITトレンドやテクノスジャパンの企業間データ連携に関する具体的な解説は省略し、データコンサルタントの視点からの言及に留めます。）
データ連携領域においては、APIエコノミーの発展、データ仮想化技術の成熟、およびiPaaS（Integration Platform as a Service）の普及といった最新のITトレンドが見られます。これらの技術動向は、異なるシステム間のデータ連携を効率化し、データ統合基盤の構築を加速する可能性を示唆しています。また、企業間でのデータ連携は、サプライチェーン最適化や新たな協調ビジネス創出のために重要性を増しており、企業間データ連携プラットフォームの活用などがその取り組みとして挙げられます。

多くの組織が直面するデータ活用基盤構築失敗の要因分析
近年、データは企業経営において不可欠な資産であり、データに基づいた意思決定（データドリブン経営）の重要性がますます高まっています。多角的な視点からビジネス課題を分析するためには、様々なデータを一極集中させ、統合的に分析できる環境整備、すなわちデータ活用基盤の構築が不可欠です。しかし、データコンサルタントの経験からは、多くの企業がデータ活用基盤構築に期待したデータに基づく成果（例：意思決定の迅速化データ、業務効率改善を示すデータ）を得られていない実情があります。この失敗の要因を分析すると、データ収集・分析プロセスの煩雑さ（多様なデータソースからのデータ抽出、変換、ロードにおける非効率性）、データ活用に必要なデータ分析スキルやデータリテラシーの組織全体の不足、およびデータガバナンス体制の不備（データ品質、セキュリティ、プライバシーに関するデータ管理の課題）などが挙げられます。

SaaSデータ統合課題：データ散在と複雑なデータ管理
多くの企業が抱える顕著な課題の一つとして、各部門で利用しているCRM、ERP、SFAなどのSaaSアプリケーションにデータが散在し、組織全体のデータ状況を統合的に把握することが難しい現状があります。これらのデータを統合して活用するためには、従来、SaaSが持つAPIの多様性やデータモデルの非互換性に対応するためのETLツールを用いた複雑なデータ連携処理や、専門知識を必要とするコーディング作業が必要でした。また、OLTP（オンライントランザクション処理）と分析処理が同じデータベースで効率的に実行できないといった、データ処理要件に応じたデータアーキテクチャ設計の課題、ETLツールやDWH（データウェアハウス）の運用にかかる時間と専門性、そしてデータソースや連携ルールの増加に伴う構成の複雑化によるチューニングやメンテナンスの困難さといった課題も、多くのデータ分析基盤につきまといます。限られたデータエンジニアリングリソースの中で、これらのデータ管理作業を効率的に行うことは容易ではありません。

ノーコードツールとAutoMLによるデータ活用効率化
このような課題に対し、データ収集・分析を効率的に行う方法として、ノーコードのデータ連携ツールとAutoML（Automated Machine Learning）技術の活用が有効です。ノーコードのデータ連携ツールを活用することで、専門知識やプログラミングスキルがなくても、直感的な操作でCRM、ERP、SFAなどの様々なデータソースを容易に統合し、分析に適した形にデータを加工することができます。これは、データパイプライン構築のプロセスを民主化し、現場部門によるデータ準備を加速します。さらに、「HeatWave」のAutoMLと呼ばれる技術を利用することで、機械学習モデルの構築・学習・評価・運用といった高度なデータ分析プロセスを自動化し、専門家でなくてもデータに基づいた高精度な予測モデルを簡単に作成・運用することが可能になります。これは、高度なデータ分析の民主化と言えます。これらのツールや技術を活用することで、大規模データの収集・分析を、データ処理時間やリソース利用効率といったデータ指標改善の観点から、効率的かつ高速に実現することが期待されます。

現場データ活用課題の特殊性分析
しかしながら、多くの企業において、特に製造業などの生産現場データ活用は、個別の設備やシステム内に留まり、全社レベルでの統合的な活用が十分に進んでいないのが現状です。生産現場には多様な設備やシステムが存在し、各装置で記録される稼働状況や品質、メンテナンス履歴といったデータは、多様なフォーマットやプロトコルで管理されているため、異なるデータ構造やセマンティクスの統合、データ品質のばらつきといったデータマネジメントの課題から、統一的に扱い、データ統合や一元管理を進めることが難しい状況です。特に高頻度で生成されるリアルタイムデータは、膨大なデータ量を処理し、時系列で正確に分析・活用する必要があるため、その管理や活用がビッグデータ処理の観点からも一層困難になっています。

Lacework FortiCNAPPのデータ分析アプローチ：クラウドリスク管理におけるデータ活用

Laceworkは、クラウド環境におけるリスク軽減において、データファーストのアプローチを採用しています。これは、セキュリティ判断の根拠となるデータ収集とその分析を最優先する戦略です。データ収集においては、エージェントレスとエージェントベースの手法を組み合わせて多様なデータソースから情報を取得します。エージェントレスアプローチにより、アカウントおよびサービスレベルでのマルチクラウド資産に関する網羅的なインベントリデータを収集し、同時にエージェントアプローチにより、クラウドコンピュートリソースに関する詳細な実行時データを収集します。これらの収集データに加え、クラウドサービスプロバイダーのログデータ、ユーザー行動データ、アプリケーションデータ、プロセスデータ、ネットワーク振る舞いデータといった、システム内部および外部とのインタラクションを示すデータを継続的に観測・分析することで、侵害の指標（IOC – Indicators of Compromise）、すなわちデータ分析によって識別される異常なアクティビティや既知の悪性データパターンを特定します。

初期データが収集されると、Laceworkは検知フェーズに進み、収集されたデータに対する分析を通じて、構成ミスデータ（例：セキュリティグループの設定不備データ、ストレージサービスにおけるアクセス権限設定データ）、脆弱性データ（例：既知の脆弱性データベースとの照合によるシステム脆弱性データ）、およびランタイムにおける異常なアクティビティデータといった、お客様のビジネスにとって最大のリスク要因をデータとして発見します。ランタイムの脅威に対しては、異常なアクティビティデータに基づいて識別されたIOCを、特許取得済みのPolygraph®データプラットフォームに表示します。このPolygraphプラットフォームは、大量のセキュリティデータに対して高度な相関分析、挙動分析、機械学習モデルを適用し、インサイトを抽出する強力なデータ分析エンジンです。ビルドおよびランタイムプロセスにおける脆弱性データ、ストレージサービスなどのクラウドリソースに存在するクラウド構成ミスデータ、そしてクラウドのベストプラクティスやコンプライアンス要件に関連する問題点といった、様々なリスクデータを特定します。

これらの問題点が最終的に、リスクスコアリングアルゴリズムに基づいてリスクレベルの高いデータポイントや関連性の高いイベント群を抽出するデータフィルタリング・集約機能を通じて提示されるため、次に進む最良の対策をデータに基づいて判断することができます。Laceworkが最も重要なリスクのみをデータとして明示することで、多くのアラートによる疲弊が解消され、コンテキストリッチなビジュアル表示（分析結果データをユーザーが直感的に理解できるよう可視化するデータプレゼンテーション機能）と通知を参考に、迅速な対策実行が可能になります。コンプライアンスの証明に役立つ包括的なレポートも提供され、これはコンプライアンス要件に関連するセキュリティ状態データやリスクデータ集計結果として利用可能です。また、チケット管理、メッセージング、SIEMなど他のセキュリティ運用ツールとの統合を通じて、リスクデータやアラートデータの連携を自動化し、問題解決プロセスを効率化することも可能です。

現場データ活用におけるデータマネジメントの課題
しかしながら、多くの企業においては、特に製造業などの生産現場データ活用が、個別の設備やシステム内に留まり、組織全体のデータ資産としての統合的な活用が十分に進んでいないのが現状です。これは、OTデータ特有の多様なフォーマット、プロトコル、データ構造、および高頻度なリアルタイムデータ生成といった技術的な特性に起因するデータ統合、データ管理、データ分析の困難性が主な要因です。各装置で記録される稼働状況、品質、メンテナンス履歴といった多様な現場データは、異なるデータ構造やセマンティクスの統合、データ品質のばらつきといったデータマネジメントの課題を抱えており、統一的に扱い、データ統合や一元管理を進めることが難しい状況です。特に高頻度で生成されるリアルタイムデータは、膨大なデータ量を処理し、時系列で正確に分析・活用する必要があるため、その管理や活用がビッグデータ処理の観点からも一層困難になっています。このようなデータのサイロ化は、組織全体のデータ資産の統合的な可視性と分析を妨げる「データ分断」の問題を引き起こしています。

産業用データパイプライン：現場データ統合ソリューションの機能評価
前述のような現場データ活用における課題に対処するため、このソリューションは現場データをリアルタイムで統合・活用するための産業用データパイプライン基盤として機能します。工場で使用される制御システムやPLC、SCADA、OPC、各種センサーなど、多様なOT（Operational Technology）データソースから、450種類以上のインターフェースを通じてデータを効率的に収集する能力は、多様なデータプロトコルおよび形式に対応するデータ収集の網羅性の高さをデータコンサルタントの視点から評価できます。収集されたデータは独自の圧縮技術を用いて時系列に整理・統合され、これは大量の時系列データを効率的に保存し、分析に適した形式に変換する高度なデータ処理と言えます。統合されたデータは、ITネットワーク内のERPやその他の基幹システムと連携するゲートウェイとして機能し、OTデータとITデータのシームレスな統合（OT/ITコンバージェンス）を実現するためのデータ連携ハブとしての役割を果たします。これにより、現場で取得したリアルタイムデータを研究開発部門、生産管理者、さらには経営層にまで共有することが可能になります。このリアルタイムデータ共有環境は、データに基づいた設備状態監視、稼働効率分析、予知保全モデル構築といった「現場オペレーションのデータ駆動型最適化」に加え、生産・供給チェーンのデータ統合分析による全社的な意思決定迅速化や戦略立案における「経営レベルでのデータ活用」を実現するポテンシャルを秘めています。

データドリブン組織実現の基盤：クラウドデータ基盤の重要性

データドリブン組織の実現は、データ収集、保管、処理、分析、活用といったデータライフサイクル全体を効果的に支えるデータ基盤の構築から始まります。実績のあるデータ基盤が存在することは、組織のデータ活用能力を飛躍的に向上させます。Amazon Web Services (AWS) をクラウドデータ基盤として使用している組織は、その提供するスケーラビリティ、多様なサービス、および運用の容易さといったメリットを享受しています。例えば、AstraZenecaはAWSクラウドデータ基盤上でデータとAIの機能をビジネス全体に統合・拡張し、イノベーションを加速し、患者の治療成果データ改善に貢献しています。現在では、510億を超える統計テストを30時間以内に実行可能となり、創薬プロジェクトへのゲノムデータ分析に基づくインサイト提供が容易になりました。BMW Groupは、サプライチェーンデータや生産データといった多様なデータをAWS上で分析し、サプライチェーンの最適化と生産能力の向上というデータに基づく成果を実現しています。また、LG AI Researchは、自社で保有するファッション、製造、研究、教育、金融などさまざまな業界のデータを活用し、生成AIアプリケーションを開発することで、ビジネスプロセスにおけるデータ分析や意思決定の変革を進めています。

組織を変革する適切なデータ基盤の構築は、適切な設計とアプローチによって実現可能です。その基礎となるデータ基盤の構築要素について、次ページから詳しく説明します。

データドリブン組織実現における主な課題と検討事項
データドリブン組織の実現を目指す上で、いくつかの主な課題と検討事項が存在します。

増え続けるデータへの対応：スケーラビリティ、パフォーマンス、コスト効率
現代においては、組織内外で生成、保存されるデータがペタバイトやエクサバイトといった規模で増え続けています。従来のオンプレミス型ツールやレガシーデータストアでは、このような今日のデータ需要に対応することは困難です。データドリブン組織には、データ量に応じて柔軟に拡張でき、かつデータアクセス（読み込み、書き込み）パフォーマンスを損なうことなく、コスト効率の高い方法でデータを保存できる、スケーラブルなデータストレージ能力を持つデータ基盤が必要です。

データサイロ化による非効率性：データ統合の困難性と分析性の欠如
組織内のデータは、ログファイル、クリックストリーム、音声、動画など多様な種類が存在し、これらが一般的に複数のデータストアや部門に分かれサイロ化されて保存されています。このデータサイロ化は、異なるデータソースからのデータ統合を困難にし、組織全体のデータ資産の統合的な可視性と分析性を欠如させます。その結果、データを活用して実用的なインサイトを引き出すことが難しくなり、データ収集・統合・分析にかかる時間とリソースの増大という形で生産性低下やコスト効率悪化に繋がります。手間とコストがかかる既存インフラストラクチャを、データ分析によるインサイト発見や意思決定支援といった価値創造の原動力に変えるには、これらのデータサイロを排除し、あらゆるデータを統合的に管理・分析できるデータ基盤の構築が不可欠です。

意思決定の複雑化とデータ分析実行のニーズ増大：柔軟性、スケーラビリティ、タイムリーな実行
Gartnerのレポートによると、今日の意思決定の65%は5年前と比較して複雑化しており、これは関係者の増加、検討すべき選択肢の多様化に伴い、意思決定プロセスにおいて考慮・分析すべきデータ量およびデータソースが増大している状況を示しています。意思決定の速度と質を向上させるためには、俊敏かつコスト効率の高いツールを用い、ユースケースごとにパフォーマンスをスケールさせて、データ分析や機械学習オペレーションを実行できるデータ分析基盤の柔軟性とスケーラビリティが不可欠です。データ分析結果をタイムリーに意思決定に反映させるためには、インフラストラクチャのデプロイや構成調整に時間をかけて反復する余裕はありません。迅速かつ継続的なデータ分析実行を可能にする基盤が求められています。

データ活用組織におけるCenter of Excellence (CoE) のデータ駆動型運営

Center of Excellence (CoE) は、その活動がビジネスの実態から乖離していると見なされ、官僚組織と捉えられてしまうリスクを抱えることがあります。このような状況を回避するためには、CoEの目標達成度をデータとして測定するためのKPIがどのように定義され、報告されるかを明確に発信し、すべての事業部門の代表者がCoEの活動やデータ活用プロセスに関与する機会を設けることで、データ利用実態やニーズに関するフィードバックを収集・分析することが不可欠です。これにより、CoEの活動をデータに基づき事業部門と連携させ、組織内での支持者を増やすことが可能になります。また、テクノロジー環境やビジネスの現状は常に進化しているため、ステークホルダーからのデータ利用に関するフィードバックを定期的に収集・分析し、CoEの戦略や活動計画をデータに基づいて調整することが重要です。KPIを使用して、データ駆動型の意思決定を行い、改善すべき領域をデータ分析によって特定し、目標に向けた進捗をデータとして追跡することで、CoEの有効性をデータに基づき証明し、その方向転換を適切に行うことができます。

データドリブンな意思決定のための基盤要件
今日のデータドリブンな世界において競争力を維持し、限られた人員と予算でより多くの成果を達成するためには、自動化され、柔軟で、スマートなデータ活用アプローチが必要不可欠です。企業における日々の意思決定プロセスを変革することは容易ではありませんが、リアルタイムのデータ収集・分析環境、ユーザーがデータにアクセスし、探索できるセルフサービスインサイト機能、およびこれらのデータ活用プロセスを支える自動化・柔軟性・スマートなデータ処理メカニズムを意思決定のサイクルに組み込むことで、変化するビジネス環境において、あらゆるチームのあらゆる人がデータに基づいた迅速なアクションを取ることを実現できます。

Tableau Blueprint：データガバナンスと分析環境の拡張
Tableau Blueprintは、信頼できるデータ環境で組織全体に分析環境を拡張するためのデータガバナンスフレームワークとして機能します。ビジネスの変革やデータ環境が変化し続ける中で、Tableau Blueprintは、データガバナンスポリシーをデータとして管理し、ビジネス要件の変化に応じて柔軟に更新できる仕組みを提供します。これにより、信頼できる管理された環境、すなわちデータアクセス制御、データ品質管理、利用状況モニタリングといったデータガバナンス施策を適用しながら、データ分析機能の提供範囲を組織内のデータ利用者全体に広げる方法論を提示します。

Tableauの機能評価：データ可視化・分析プラットフォーム
Tableauは、ユーザーがデータを見てそれを理解することを支援する、世界をリードするデータ可視化・分析プラットフォームです。強力なAI機能（例：機械学習モデルを活用した異常検知や予測）、データ管理機能（多様なデータソースからのデータ統合、データ品質管理）、およびコラボレーション機能を備えたビジュアル分析を提供します。これらの機能は、高度なデータ分析、多様なデータソースからのデータ統合と品質管理、そして分析結果データやインサイトの組織内での共有・共同作業を可能にし、実効力のあるデータドリブンな意思決定を促進します。個人からあらゆる規模の組織に至るまで、世界中の組織がTableauをデータドリブンな意思決定促進のための分析プラットフォームとして選択しており、その導入実績データはその効果を示唆しています。

さらに、Tableauは、企業を顧客データの共有ビューにつなぐ顧客関係管理 (CRM) プラットフォームであるSalesforce Customer 360（顧客データプラットフォーム – CDP）と統合されています。この連携により、Customer 360に集約されたリアルタイムの顧客関連データをTableauで活用し、データに基づいた顧客データ分析とインサイト抽出を可能にします。顧客の行動データ、購買履歴データ、嗜好データなどの分析に基づいた、よりパーソナライズされた顧客体験の提供をデータ駆動型で促進できます。また、分析結果データを業務ワークフローに直接連携させ、データに基づいて迅速なアクションを取るための機能を活用することで、特別なカスタマーエクスペリエンスの実現を促進することができます。顧客データを仕事の中心に据えることで、顧客や従業員との関係をデータに基づき成長させることができます。

ビジネスへのデータ利活用における主な課題分析
ビジネスへのデータ利活用において現在多くの組織が抱えている課題をデータコンサルタントの視点から分析すると、以下のような点が挙げられます。

データ分析と意思決定の断絶: データ分析結果がビジネスアクションや意思決定プロセスに効果的に結びつかないデータ活用の断絶、あるいは組織全体のデータ分析能力の不足。
データサイロ化と統合困難性: 組織ごとに様々なシステムを使用しており、データが散在していることに起因するデータサイロ化と、それに伴うデータ統合の技術的・運用的な困難性。
データ資産の品質・信頼性・安全性の課題: データガバナンス体制の不備、データ品質管理プロセスの不足、データセキュリティ対策の不徹底といったデータ資産に関する信頼性および安全性の課題。
高度なデータ分析能力の不足: AIやMLといった高度なデータ分析を実行するための適切なスキルを持った人材、必要な分析ツール・基盤、および効果的な分析シナリオ定義の不足。
データ連携コストと運用負荷: 異なるシステム間のデータ移行、連携、同期にかかるコストや、ETL/ELTプロセスの複雑性に起因する専門人材の稼働が高い状況。
データ人材不足と育成課題: 組織全体のデータリテラシー不足、データ分析専門人材の不足、およびデータ人材の育成や教育に対する組織的な取り組みの遅れ。
データ活用における重要な視点
生成AIの時代にデータ基盤を構築する要諦
生成AIの時代において、データ基盤は多様な非構造化データを含む大量のデータを収集・管理し、高度な分析や機械学習モデルの学習に利用できるスケーラビリティと柔軟性を持つことが求められます。データガバナンスとデータセキュリティを組み込んだアーキテクチャ設計が不可欠です。

データを最大限に活用するための3つの重要なポイント

データ統合と品質管理: 多様なデータソースを統合し、データ品質を確保するためのデータパイプラインとガバナンスプロセスを確立すること。
データ分析能力の向上と民主化: 組織全体のデータリテラシーを高め、セルフサービス分析ツールや自動化ツールを活用して、誰もがデータにアクセスし分析できる環境を整備すること。
データ駆動型意思決定プロセスの定着: データ分析結果をビジネスアクションに繋げるための明確なプロセスを定義し、データに基づいた意思決定を組織文化として根付かせること。
データは有意義なイノベーションを実現する原動力
適切に収集、管理、分析、活用されたデータは、単なる情報ではなく、新しい製品・サービスの開発、業務プロセスの改善、顧客体験の向上といった、ビジネスにおける有意義なイノベーションを実現するための強力な原動力となります。

データの戦略的価値：現代ビジネスにおける変革の原動力

今日、データはこれまで以上に、あらゆるアプリケーション、プロセス、ビジネスの意思決定の中核となっています。組織内外で生成される多様なデータの量、種類、および速度の増加を背景に、データ資産が持つ潜在的なビジネス価値（インサイト、予測、自動化機会）は増大しており、データは現代における変革の強力な原動力となっています。変化が激しく複雑な世界において、データをどのように効果的に活用するかが、組織のイノベーションを加速し、目標達成を実現するための強力な鍵となります。データ活用がもたらすビジネス機会は大きく、Forrester Researchのレポートによると、「インサイト主導型の高度なビジネス能力を備えている企業は、初期段階の企業と比較して、年間収益が20%以上増加したと報告する割合が8.5倍である」とされており、これはデータ分析能力の高い企業が収益データで明確な優位性を示していることのデータに基づいた根拠と言えます。

生成AIの出現は、データの重要性を改めて強く認識させました。ビジネスニーズに特化した生成AIアプリケーションを構築する際、高品質でドメイン固有のデータは決定的な差別化要因となります。汎用アプリケーションから脱却し、顧客とビジネスに真の価値をもたらす生成AIアプリケーションへと移行する上で鍵となるのは、特定のビジネスニーズに対応するためのデータ収集、前処理、モデル開発、評価といったデータエンジニアリングおよびデータサイエンスのプロセスです。

生成系 AI への取り組みを今すぐ始めましょう
本ガイドで紹介する生成AIのビジネス活用ユースケースは、それぞれが特定のデータを活用し、データ分析や生成タスクを実行することで、ビジネス上の課題解決やデータ指標改善に貢献する可能性を示しています。これらのユースケースは、業界アナリストの分析や市場のデータとも一致しており、AWSのお客様が現在これらのユースケースを活用して影響力のある測定可能な結果を達成していることが導入実績データや効果測定データから確認されています。つまり、これらのユースケースは、生成AIを適用するのに適したアプリケーションやプロセスを判断する際に検討すべきデータ要件と技術的実現可能性を備えているということです。

これらのユースケースは、データに基づいた検証と実装を通じて比較的短期間（数ヶ月程度）で完了でき、実際のビジネス上の課題をデータ分析によって特定し解決し、システムパフォーマンス向上（処理時間短縮、応答速度向上）、コスト削減、カスタマーエクスペリエンス向上（顧客満足度データ改善）といったデータ指標での効果をもたらすことが期待されます。さらに、概念実証（POC）のユースケースは、限定されたデータセットとリソースを用いて、特定のユースケースにおける生成AIの技術的実現可能性、パフォーマンス、およびビジネス価値をデータとして評価するための有効な手段です。POCは短期で着手しやすく、比較的低コストで実施できます。技術エキスパートや分野エキスパートが参加するのにも適しており、データに基づいた注目すべき結果を生み出すことで、経営幹部からAIの幅広い導入に対するデータに基づいた賛同（投資承認データなど）を得るための重要なステップとなり得ます。

生成系AIのビジネスでの可能性は、ここで挙げた7つのユースケースに留まりません。AWSはAIサービスと機械学習ツール群を幅広く提供しており、これは生成AIアプリケーションを構築・運用するためのデータ基盤、モデル開発ツール、およびデプロイ環境を提供します。これらのサービスを活用することで、組織がデータ分析やモデリング能力を新たな高みに引き上げ、データから何を達成できるかに関する新しいアイデア（データに基づいた新たなビジネス機会やプロセス）を生み出すことを支援しています。

何かを新たに作り出す必要はない
生成AIの導入は、必ずしもゼロから何かを新たに作り出すことから始める必要はありません。既存のデータ資産と業務プロセスを分析し、本ガイドで紹介するような実績のあるユースケースを参考に、データに基づいたアプローチで生成AIの活用を開始することが、迅速な成果創出への近道となります。

データ分析ツールのデータ探索・可視化デモンストレーション

本セッションでは、データ分析ツールを利用したデータ探索および可視化プロセスのデモンストレーションを行います。これは、データ分析の効率化に課題を抱える組織や、複雑なBIツールからのインサイト抽出に苦慮している担当者、およびデータに基づいた意思決定を組織内で推進したい事業部門の担当者を対象としています。

データ活用の重要性と困難性：ハイブリッドクラウド環境における課題分析
データは、企業の競争力強化、利益拡大、イノベーション促進に向けた新しいアプローチを見出すための、不可欠なビジネスインテリジェンスと洞察の源泉となります。しかし、それはデータ収集、処理、分析、活用といったデータライフサイクル全体が効率的であり、データが適切な場所とタイミングで活用できる場合に限られます。今日のデータ急増とIT環境の複雑化に伴い、とりわけクラウド、データセンター、エッジといった要素が混在する最新のハイブリッドクラウド環境では、多様なデータソースからのデータ収集・統合、異なるデータプラットフォーム間でのデータ移動、およびペタバイト規模のデータ処理における技術的・運用的な課題により、データを最大限に活用することは困難となっています。

HPE Intelligent Data Platform：データ提供、管理、分析を統合するプラットフォーム
HPEのIntelligent Data Platformは、このようなハイブリッドクラウド環境全体にわたるデータの提供、データ管理、およびデータ分析を統合的に行うプラットフォームです。AI主導でクラウドに対応し、As-a-Serviceで提供されるこのプラットフォームは、データ管理・分析プロセスの自動化、クラウド環境への柔軟な対応、および従量課金モデルによるデータ活用リソース提供の柔軟性といった特長を持ち、クラウド、データセンター、およびエッジでのデータの提供、管理、分析方法を刷新します。

データ駆動型IT運用管理：ITインフラデータの活用
企業で生成および処理される膨大なビジネスデータを活用することで、顧客関係、運用効率、競争力を向上させることができます。データはイノベーションを促進し、アジリティを向上させますが、このデータ本来のメリットを獲得するには、データの鮮度、関連性、アクセス容易性といったデータ品質およびデータアクセス性が確保され、適切な場所とタイミングでデータ利用する必要があります。

データは、オンプレミスのプライベートクラウド、パブリッククラウドサービス、従来型データセンターシステム、および各エッジから成る、ハイブリッドクラウド環境のあらゆる場所で作成、保存、利用されますが、異なるデータストレージやプラットフォームに分散したデータ資産は、柔軟性のない組織構造によってサイロ化されています。データの可用性とセキュリティの確保という役割を担うIT部門は、これらのデータ統合困難性、およびデータ管理・運用の複雑性に起因するリソース制約といった課題に直面しています。

幸い、AI、予測分析、自動化といった、企業がビジネスデータから価値を引き出すテクノロジーは、IT部門がインフラストラクチャデータ（ログデータ、パフォーマンスデータ、設定データなど）から価値を引き出すうえでも役立ちます。HPEのIntelligent Data Platformは、データを保存するだけにとどまらず、データの管理、提供、分析方法を刷新するプラットフォームです。AI機能と、ITインフラストラクチャデータから得られる有益な情報を活用し、データを必要な場所とタイミングで活用できるようにすることで、インフラ運用データの分析に基づいた障害予測、原因特定、自動修復といった「データ駆動型IT運用管理」を実現し、運用コストの削減とサービスデリバリの迅速化といったIT運用効率を示すデータ指標の改善を可能にします。

クラウド対応の設計となっているため、IT部門は、ビジネス部門がクラウドコンピューティングに求めるアジリティ、すなわちデータ活用基盤の柔軟性を提供することができます。また自動化されたセルフサービス型インフラストラクチャと柔軟な従量制消費モデルとともに、As-a-Service のエクスペリエンスを提供します。HPE の Intelligent Data Platformによって、常時稼働、常時高速、常時アジャイルなIT運用でイノベーションに注力できる企業、すなわちデータに基づいた迅速かつ効率的な意思決定・運用が可能なインテリジェントエンタープライズが実現できます。

HPE Intelligent Data Platformがもたらす定量的なデータメリット
HPE Intelligent Data Platformは、導入組織に次のようなデータに基づいた定量的なメリットをもたらします。

障害の90%をデータ分析によって特定および予測し、IT部門が障害を認識する前にその86%をデータに基づき自動的に解決します。
障害の54%を構成ミス、ホスト、ネットワーク、 VMといったストレージ以外のデータに起因する要因に切り分け、原因特定の効率を向上させます。
数千社のお客様の環境で99.9999%を超える実測可用性を実現しており、これはそれぞれのお客様の環境で発生するダウンタイムが年平均25秒未満であるというデータに裏付けられています。
ストレージ関連のトラブルチケットの解決に要する時間を85%短縮し、IT運用の効率化に貢献します。
ストレージ関連の運用コストを79%削減します。
パフォーマンスをデータとして75% 向上させると同時に、消費電力をデータとして40%削減します。
製品開発の生産性をデータとして2倍に向上可能にします。
展開に必要な時間を数時間から数分にまで短縮し、データ基盤の迅速なプロビジョニングを可能にします。
ビジネスに成果をもたらす、データ分析に基づくインテリジェントな意思決定
これらのデータに基づいた改善は、ビジネスに成果をもたらす、データ分析に基づくインテリジェントな意思決定を可能にする基盤を提供します。

生の非構造化データ：潜在的価値とデータエンジニアリング・データサイエンスの役割

今日、データはデータレイクまたはクラウドストレージ内に保存される生の非構造化データとして存在することが多くなっています。これには、ソーシャルネットワークフィードによって作成されたストリームデータや、IoTデバイスから収集されるセンサーデータなどが含まれます。これらのデータは、そのままの状態ではその最大の可能性が未知数であり、データサイエンティストによるマイニングおよび変換プロセスを通じて、潜在的なインサイトや未知のビジネス機会を含む将来的な価値のデータソースへと変換される必要があります。これは、非構造化データから価値を抽出し、分析可能な構造化データへ変換するためのデータエンジニアリングおよびデータサイエンスの重要な活動です。

データ分析需要の高まりとクラウドデータ処理基盤へのシフト
データに基づいた意思決定と業務効率化に対する組織的な要求が高まるにつれて、ナレッジワーカーからのデータアクセスおよび分析に対する需要が増大しています。データ分析アプリケーションは、分析対象のデータが近接して配置されている環境で最も効率的に機能するというデータ処理の物理的・論理的な要件があります。この要件を満たすためには、大規模なデータセットに対応できる堅牢なストレージ、データ処理、および分析サービスを並行して実行できるクラウド環境への大規模なシフトが必然となります。クラウドは、これらのサービスを柔軟かつスケーラブルに提供できるデータ処理基盤であり、ペタバイトやエクサバイト規模のビッグデータ分析を可能にします。クラウドベースで既に大規模なビッグデータ処理を行っている組織においても、まだデータの分析に本格的に着手していない組織においても、ビジネス部門やIT部門のユーザーがデータからパターンを視覚化し、分析を通じてインサイトを得ることができるようになれば、それはデータ活用能力の向上という形で大きなメリットをもたらします。

モダン分析とデータ活用の複雑性
モダン分析ツールは、スキルレベルを問わず、より多くのビジネスユーザーに広範なデータ分析機能をもたらし、データ活用の民主化を促進します。しかし、これらの多様なデータを組織全体にとって有用なリソースに変えるためには、データ収集、統合、品質管理、ガバナンス、セキュリティといったデータマネジメント全体にわたる多くの複雑な課題が存在します。ビジネスニーズはデータ自体と同じくらい頻繁に変化するため、変化するデータ環境とビジネス要件に対応できる、アジャイルで適応性のあるビッグデータ戦略と、それに則したデータ処理パイプラインとデータモデルの柔軟性を持つアーキテクチャが必要になります。特定の技術に固定され、データ接続のみを重視したモノリシックなプラットフォームを構築することは、進化を続ける分析ユースケースや新たなデータソースに対応できないデータアーキテクチャの硬直性というリスクを伴うため、避けるべきです。組織は、ビッグデータの活用機会の範囲を広げ、将来の分析使用事例についても考慮したデータ戦略とアーキテクチャを構築することが賢明です。そうしなければ、データが持つ潜在的な全体像とそこから得られるインサイトを掴み損ねるリスクがあります。

ビッグデータがもたらす課題：コスト、接続性、パフォーマンス
データ資産をどのように管理・活用しているかは、ビジネスがデータ分析能力を通じて高い収益性を得られるのか、あるいは悪戦苦闘するのかの大きな分岐点となります。しかし、巨大な規模で成長を続け、その種類も多様化しているデータを扱うことは、特にリレーショナルデータベース管理システムの観点からは大変で高額な費用がかかります。これは、リレーショナルモデルが非構造化データや半構造化データ、および大規模な時系列データの効率的な管理・処理に適していないというデータモデルの限界および、データ量増加に伴うストレージ・処理能力拡張のコスト増大に起因します。組織は、データ処理における計算効率とデータ局所性の最適化、すなわち事前計算や計算結果の共有によるハードウェアコストの削減や、データの移動を最小化することを求めています。最もアジャイルな方法でデータを移動させることが可能なインフラストラクチャは、生の非構造化データと、分析できるように準備されたデータ間のデータ連携の柔軟性を提供し、このギャップに対処する上で役立ちます。

また、組織はデータへの接続性とパフォーマンスの問題にも直面しています。ライブ接続やインメモリ分析といった選択肢がある場合でも、大規模なデータレイクからのデータ抽出生成や、他のデータセットとのブレンドといった操作は、データ量やデータ構造に起因してデータ処理エンジンの負荷が高くなりすぎる可能性があります。モダンなセルフサービスデータ分析アプローチはアジャイル性に関して多くのメリットを提供するものの、これらの大規模データセットに対する大規模な結合処理を実行すれば、データ分析ツールにおけるデータ処理エンジンの負荷分散や最適化の限界により、システムに過剰な負荷がかかる場合があります。これらの技術的な課題に対処するためには、データ処理基盤のアーキテクチャ設計とパフォーマンスチューニングが不可欠です。

HPE Intelligent Data Platformのデータ分析的メリット：運用効率データ改善とデータイノベーションへの投資転換
効率の向上と運用コストの削減だけが、HPE Intelligent Data Platformが提供するメリットの全てではありません。ストレージ関連の問題解決に必要な時間が85%減少し、ストレージ関連の運用コストがデータとして79%削減されることは、IT部門がデータ分析に基づいたインサイトを活用し、ストレージメンテナンスといったリアクティブな作業から、データのプロアクティブな管理や、ビジネス部門が求める成果達成を加速するためのデータイノベーションへの投資へと時間と資金を再配分することを可能にします。データアクセスパターン、利用頻度、セキュリティ要件などのデータ分析に基づき、最適なデータ配置を判断し、最も高い効果が得られる場所にデータを移動させるデータ最適化機能により、ストレージインフラストラクチャへの投資をデータそのものの活用によるイノベーションへの投資に転換できます。HPE Intelligent Data Platformは、データ活用を阻むさまざまな障害を取り除き、イノベーションに向けて強力なデータ処理・分析テクノロジーを提供することで、ビジネス部門が期待するビッグデータのメリット、すなわちデータに基づいた競争優位性の確立や効率性向上といった成果を実現します。

データの進化と分析需要：ビッグデータの特性とデータマネジメントの課題
データはもはや特定の場所に限定されるものではなく、あらゆる場所で生成・存在しています。そのため、データへのアクセスと分析の需要もどこにでも存在します。「ビッグデータ」という言葉は流行語として定着したように見えますが、ビッグデータの「3つのV」、すなわちVolume (量)、Variety (多様性)、Velocity (速度)は、データ量、データ種類、データ生成・処理速度の増加として、ビッグデータ分析の使用事例においてこれまでにも増して顕著になっています。主観的ではあるものの、これらのVや業界が議論しているその他のV（Variability (変動性 – データの変化や不整合性)、Validity (有効性 – データ形式や構造の正確性)、Veracity (正確性 – データの内容の信頼性)など）は、データ品質と信頼性に関するデータマネジメントの重要な課題を浮き彫りにしています。今日のビッグデータは非常に複雑になっており、組織がそれを効果的に収集、整理、理解、活用するためには、多様なデータソースからのデータ収集、異なるデータ形式の統合、データ品質保証、データ分析によるインサイト抽出といったデータマネジメントおよびデータ分析プロセス全体における技術的・組織的な課題を克服するためのイノベーションが必要です。

デジタル変革とデータ形式の多様化
各業界のすべての規模の組織では、デジタル変革の進展に伴い、センサー、IoTデバイス、モバイルデバイス、ウェブサイトといった、さまざまな形式やソースの膨大なデータを生む「モノ」やインタラクションが大量に存在しています。組織はこれまでにないほど多様なデータを収集、処理、分析しており、スキーマのないJSONデータ、他のデータベース（リレーショナルやNoSQL）からのネストされたデータタイプ、フラットではないデータ（Avro、Parquet、XMLなど）を含むデータ形式は増加の一途をたどっています。これらの多様なデータ構造に対応し、それらを効果的に処理・分析するためには、多様なデータソースからのデータを取り込むためのデータコネクタと、これらのデータを効率的に処理できるデータ処理エンジンの重要性が増しています。

データ特性分析：構造化データと半構造化データの利用とポテンシャル
組織は往々にして、異なるデータ特性を持つデータ形式を組み合わせて利用しています。

構造化データ: 特定の質問に対する事前計算や集計が可能なデータであり、通常はリレーショナルデータベースやデータウェアハウスに保存されます。これは、インメモリコンピューティングのために抽出されたり、分析のために事前に集計・加工されたりしている、比較的分析効率が高いデータです。組織が保持するデータの中で最も絞り込まれており、比較的簡単にアクセスおよび利用できるデータ資産と言えます。
半構造化データ（またはオブジェクトストレージ内のデータ）: 通常、リレーショナルデータベース、データウェアハウス、またはデータマート内に保存されているものを含むだけでなく、オブジェクトストレージに保存されることも多いデータです。リレーショナル形式に加えて柔軟な構造を持ち、データ要素がネストされていたり、スキーマが厳密でなかったりする特性があります。これらのデータは、特定のエンティティ（顧客、製品など）に関する詳細な情報を含み、エンティティ分析のために定期的に更新されるビジネスコンセプトと関連付けられることが多いです。例えば、トランザクションデータ、商談データ、または個々の営業担当者が商談に関してとる行動に関するデータなどが該当します。半構造化データは、既知の質問（例：顧客の購買履歴データ）に対して、従来の構造化データ分析では得られなかった未知の回答（例：隠れた購買パターン、将来の購買行動予測）を得る可能性を秘めているデータであり、その活用ポテンシャルは非常に高いと言えます。

データドリブン・データ活用（11）

2024年1月	1件　非鉄製品製造業
2024年2月	1件　医療関連サービス業
2024年3月	2件　物流業、機械製造業
2024年4月	1件　金属製品製造業
2024年5月	1件　サービス業
2024年6月	2件　設備工事業、不動産業
2024年7月	1件　飲食料品小売事業
2024年8月	1件　機械製造業
2024年9月	1件　化学工業
2024年10月	1件　人材派遣業
2024年11月	0件
2024年12月	1件　機械製造業
2025年1月	0件
2025年2月	0件
2025年3月	1件　製造業
2025年4月	1件　サービス業
2025年5月	1件　建設業
2025年6月	1件　金属加工業
2025年6月	1件　サービス業
2025年6月	1件　不動産業
2025年7月	1件　製造業
2025年7月	1件　食品サービス業
2025年7月	1件　製造業








ご相談・お問い合わせ