可視化とアラートの最適化アプローチ
データコンサルタントの視点から見ると、可視化とアラートの仕組みは、組織内の最適化活動を促進し、効率的なコスト削減とリソース管理を実現するために重要です。可視化は、ただデータを提供するだけでなく、行動の変化を促す効果的な手段として機能させる必要があります。以下は、具体的な最適化方法とデータ活用の視点から、戦略的な改善点です。
1. 最適化の進捗と成果の可視化
組織内の複数チームが最適化に取り組む際、単に上位チームをリスト化するだけではなく、最適化の余地とそれによる成果を明確に示すことが必要です。たとえば、特定のインスタンスやリソースを見直すことで、コスト削減とパフォーマンスのバランスをとる具体的なシナリオを示すことが有効です。以下のような可視化戦略が考えられます:
KPIベースの可視化: 各部門のパフォーマンス指標(コスト削減率、リソース使用効率)を一目で確認できるダッシュボードを提供し、具体的な改善効果を即座に把握できるようにする。
インパクト予測の提供: 仮想マシンのサイズを調整することでどれだけのコスト削減が可能か、またはパフォーマンスがどの程度維持できるかなどの予測情報を提示する。
2. 行動を促すアラートとレポートの統合
可視化されたデータを基に、アクションを促すアラートやレポートを作成し、エンジニアや意思決定者に適切なタイミングで通知することが、行動変化を促す鍵となります。特に、SlackやJIRAなど、既存のツールにアラートを統合することで、シームレスなワークフローが維持され、実際のアクションに結びつきやすくなります。
リアルタイムアラート: クリティカルなリソースの過剰使用や潜在的なコストオーバーランをリアルタイムで通知し、即時対応を促す。
カスタマイズ可能なレポート: チームやプロジェクトごとにカスタマイズされたレポートを定期的に提供し、最適化の進捗状況や次のステップを明確化する。
コスト管理の強化:ショーバックとチャージバック
コスト管理に関しては、多くの企業が導入しているショーバックやチャージバックの戦略は、チームにコスト意識を持たせ、行動を変える有効な手段です。
1. ショーバックからチャージバックへの移行
ショーバックは、各チームに対してその消費リソースに対する透明性を提供しますが、チャージバックは実際のコスト負担をチームに転嫁することで、より直接的な財務責任を与え、行動の変化を加速させます。Vanguard Groupの例では、チャージバックの導入が、チームの迅速な行動変化を促したと報告されています。
ショーバックの導入: 最初にコスト可視化を目的としてショーバックを導入し、各チームがどのリソースにどれだけのコストをかけているかを定量的に把握させる。
チャージバックへの移行: コスト意識が高まった段階で、チャージバック方式に移行し、コスト削減や効率化を進めるインセンティブを強化する。
2. コストの透明化と分析ツールの提供
効果的なコスト管理には、各チームがコスト削減の余地を見つけやすくするための分析ツールの提供が不可欠です。これには、個別のプロジェクトやチームごとにリソースの使用状況を細かく分析できるツールが含まれます。
ゲーミフィケーションを活用した最適化の推進
最適化の取り組みを促進するために、ゲーミフィケーションを取り入れたアプローチは、多くの企業で成功を収めています。これにより、競争意識を高め、従業員のエンゲージメントを向上させることができます。
1. 最適化活動の評価と報酬
大手通信会社の例では、最適化を進めたチームや従業員を評価するためのゲーム方式が効果を上げています。この方法では、コスト削減、セキュリティの向上、プロセスの自動化などに対する貢献度に基づいてポイントを付与し、表彰や報酬を提供することで、チーム全体の意識向上を図ります。
最適化に対するインセンティブ: コスト削減やプロセス改善の達成に対するインセンティブを設定し、各チームの競争を促進する。
リーダーボードの公開: 効果的な企業文化に合った形で、上位チームや最適化に貢献した従業員を公表し、組織全体の最適化意識を高める。
2. ネガティブアプローチの回避
一部の企業では、成果を上げられなかったチームを公表するケースもありますが、この方法は企業文化によっては逆効果となることもあります。したがって、ネガティブな要素に焦点を当てるのではなく、前向きな評価と報酬に基づくアプローチが推奨されます。
結論
可視化とアラート、コスト管理、ゲーミフィケーションの戦略を組み合わせることで、組織内での最適化活動を大幅に向上させることができます。各チームに適切なデータを提供し、行動変化を促す仕組みを整えることが、最終的なコスト削減とパフォーマンス向上につながります。







データコンサルタントの視点で、組織に対するデータの可視化と最適化の重要性を理解させるとともに、KPIの適切な活用方法を提案します。最適化プロセスの継続的な取り組みや、データガバナンスの強化、自動化のメリットを強調しました。
最適化は継続的なプロセス:
最適化が一度限りではなく、継続的なプロセスであることを強調し、単に最適化を行うだけでなく、その成功を測定し、次の段階に進む必要性をクライアントに理解させます。
「データの可視化と最適化の持続的なアプローチ
データインフラの最適化は、一度実施して完了する作業ではありません。真に効果を持続させるためには、定期的にデータのパフォーマンスを評価し、改善を図る継続的なプロセスが必要です。最適化が進むにつれ、データの複雑さが増し、リソースの管理が難しくなるため、ガバナンスの強化や自動化の導入が不可欠になります。」
KPIの活用で最適化の成功を評価:
最適化の効果を具体的に測定するためには、適切なKPIを設定し、組織全体でモニタリングすることが重要です。ここでは、データの最適化成功を評価するための主要なKPIをリストアップし、各KPIがどのように組織のパフォーマンス向上に寄与するかを説明します。
「最適化段階の成功を測るためのKPI
最適化が効果的かどうかを評価するには、以下のような具体的なKPIを活用することが重要です。これらの指標は、リソース使用の効率性、コスト削減、セキュリティリスクの軽減、運用安定性を可視化するのに役立ちます。
オンデマンドで使用されているインフラの割合 (%): 予約や割引プラン外のリソースがどの程度利用されているかを測定し、リソース最適化の度合いを示します。
ライトサイジングによる節約 (%): 適切なリソースサイズにより、どれだけコストが削減されたかを評価します。
リソースあたりの実効コスト (金額): コンピューティング時間などのリソース単位ごとのコストを明確にし、効率性の向上を目指します。
アプリケーション/チーム別の本番環境インシデント (件数): チームやアプリケーションごとのシステム障害を監視し、安定性を追求します。
展開を元に戻した割合 (%): システム変更の結果、元に戻す必要があったケースの割合を確認し、変更管理の改善を図ります。
平均修復時間、平均故障間隔 (時間): 障害発生から修復までの時間や、故障の発生頻度をモニタリングし、信頼性を向上させます。
セキュリティ違反の数 (件数): IAM(アクセス管理)エラーや開いているポートなど、セキュリティ上のリスク要素を把握し、リスク管理を強化します。
構成の標準を満たさない資産数 (件数): 仮想マシンタイプや場所、OS、タグ付けの違いなど、標準に従わない構成を特定し、一貫性を確保します。」
ガバナンスと自動化の重要性:
最適化の次のステップとして、データガバナンスや自動化への移行を推奨します。特に、最適化されたインフラを維持しながら、ガバナンスや自動化を進めることで、長期的な運用コストの削減と効率向上が期待できることを強調します。
「ガバナンスと自動化による持続的最適化の実現
最適化の初期段階を成功させた後、多くの組織は次のステップとしてデータガバナンスと自動化に進みます。これにより、リソースの管理を効率化し、セキュリティリスクや運用コストを最小限に抑えることが可能です。データのガバナンス強化により、コンプライアンス要件の遵守が確保され、自動化されたプロセスによって人的ミスの削減や運用のスピードアップが期待できます。」
最終的に、組織に対してKPIに基づいた継続的なモニタリングを提案し、データの可視化を活用した最適化プロセスを長期的に成功させるための推奨事項をまとめます。
「最適化プロセスの継続と推奨事項
最適化は持続的な取り組みであり、定期的なKPIモニタリングがその成功に欠かせません。データの可視化を駆使して、リソースの利用状況や効率性を常にチェックすることで、コスト削減とパフォーマンス向上が可能です。データガバナンスの強化と運用の自動化を進めることで、長期的に安定した最適化の効果を維持し、組織全体のデータ戦略を成功に導くための基盤が築かれます。」
このように、データの可視化と最適化の重要性を強調しながら、クライアントがKPIを活用して継続的に改善できるようなデータ戦略を提案しました。


インフラストラクチャの可視化の重要性
ITサービスの迅速かつ効果的な提供には、インフラストラクチャとプロセスの明確な可視化が不可欠です。手動タスクに依存したり、インフラストラクチャが可視化されていない場合、サービスの正確な提供は難しくなります。適切なプラットフォームによって、インフラストラクチャ、クラウドリソース、アプリケーション、サービス全体の可視性を確保することで、関連するサービスの全体像が把握でき、特定のコンポーネントへの迅速なトラブルシューティングが可能となります。
サービスマッピングと検出プロセスの構築
可視化の第一歩として、オンプレミスおよびクラウドの運用環境全体の把握を行い、その上で、動的なITコンポーネントとビジネスサービスの関係性をマッピングします。このプロセスにより、各サービスがどのインフラストラクチャに依存しているかが明確化され、可視化されたインフラの中での位置付けを把握しやすくなります。
共通データベースを用いたサービスとインフラの連携
共通の構成管理データベース(CMDB)を活用することで、ビジネスサービスとITインフラストラクチャの包括的な接続ビューが可能になります。これにより、どのIT資産がどのサービスに影響を及ぼすかを明確にし、インフラとサービスの関連性を可視化します。
問題解決プロセスの記録と可視化
解決済みのインシデント情報をナレッジ管理システムに保存することで、トレンドや根本原因分析を行い、類似インシデントの発生を防ぐことができます。また、過去の解決策が可視化されていることで、問題解決の迅速化と再発防止の両方を支援します。
役割別にカスタマイズされたレポートの提供
役員、サービスオーナー、従業員といった異なるペルソナに基づいたカスタマイズレポートを提供し、意思決定に役立つ情報をわかりやすく提供します。これにより、各役割に必要な情報を的確に提供し、ビジネス上の意思決定プロセスが円滑に進むようサポートします。
資産情報の包括的な管理
資産管理機能を導入し、社内外の資産、在庫、移動中の資産を一元的に管理します。コスト情報を含むことで、減価償却やライフサイクル管理も容易となり、資産に関する財務管理の向上が期待できます。
この構成により、インフラストラクチャの可視化を軸にしたデータ管理の重要性と、その実現のための具体的なアプローチを明確にしました。


データコンサルタント視点から見るデータ配信レイヤー、オブザーバビリティ、およびプラットフォームエンジニアリング
データコンサルタントの視点から、リスク分析、GDPRコンプライアンス対応、およびBIレポーティングといった多様なITユースケースにおけるデータ活用の重要性を考察します。例えば、リスク分析では、電子詐欺データ、サイバークライムデータ、アンチマネーロンダリングデータなど、特定のデータモデルを活用したデータ分析が有効な手段となります。
データ配信レイヤーの役割:GDPRコンプライアンスとBIレポーティング
GDPRコンプライアンス対応において、多数の異なるシステムに分散するデータを統合する必要がある場合、論理データファブリック(データの物理的な配置に依存しない、抽象化されたデータアクセスレイヤー)がレポート作成用に透明性レポート(監査に必要なデータ)を提供できる点は重要です。特定のプラットフォーム(Denodo Platformなど)が、このタスクのために適切なデータ連携機能(フェデレーション機能)を提供し、分散データ環境におけるデータガバナンスとコンプライアンス対応を支援します。
従来のBIレポーティングにおいても、大規模ユーザーベースをサポートする場合、論理データファブリックがデータソースとBIツール間のチャンネルとして機能し、データ可視化を実現します。特定のプラットフォームを通じて、データがBIツールに提供されるプロセスは、データ利用者が意思決定に必要なデータに迅速にアクセスできるようにするために不可欠です。
リーダー的組織が重点を置く論理データ配信レイヤーの要件評価:データ運用とビジネス成果
リーダー的組織は、データ運用とビジネス成果の観点から、論理データ配信レイヤーの要件評価に重点を置いています。環境全体を包括的に可視化すること(運用データ、セキュリティデータ、パフォーマンスデータなどのデータ可視性向上)によるシステムダウンタイムデータ削減と、ダウンタイム発生時の迅速なデータ復旧は、データ可用性およびデータレジリエンス(回復力)の観点から極めて重要です。また、開発者が大量の定型業務(運用工数データ)に忙殺されることなくイノベーションに注力し、製品を短いリリースサイクルデータで提供することで、ビジネス成長データに繋げている点は、データ駆動型組織におけるIT部門の役割の変化とデータ配信レイヤーの貢献を示唆しています。
先進的なオブザーバビリティプラクティスとOpenTelemetryの活用
リーダー的組織が他の組織を凌駕している点の一つとして、先進的なオブザーバビリティプラクティス(システムの状態を詳細な運用データに基づいて理解する能力)を実現していることが挙げられます。OpenTelemetryのような標準の導入率が高い(調査データ引用)ことは、この標準への投資価値がデータによって示されていることを意味します。OpenTelemetry導入のメリットを、データ管理の向上(運用データの収集、統合、標準化)、ベンダーロックインリスクの回避、より広範なデータエコシステム(異なるツールやプラットフォーム間でのデータ連携)の活用といったデータ関連の観点から評価できます。導入の課題として、OpenTelemetryに精通した人材(人材データ、スキル不足)がいないことが挙げられますが、その解決策の一つが既存の人材の活用です。既存人材活用は、組織が最新テクノロジーの導入や従業員の教育と成長に前向きであることを開発者(人材データ)に示すとともに、組織内のエンジニアをOpenTelemetryのエキスパートとして育成することで、導入の成功率(プロジェクト成功データ)を高める効果があります。また、イノベーション精神を組織内に浸透させることで、将来的に新しい人材を惹きつけることにも繋がります。開発チームによるOpenTelemetryの学習意欲を高めるためには、オブザーバビリティベンダーのサポートも有効ですが、データコンサルタントとしては社内トレーニングプログラムを構築することを推奨します。そのためにはまず、チームの中でOpenTelemetryの導入に積極的でやる気のある推進者(人材データ)を見つけ、プロジェクトWebサイトやGitHubでの学習、CNCF Slackグループなどのコミュニティへの参加を促すことが効果的です。
プラットフォームエンジニアリングの役割:運用効率と開発速度の向上
プラットフォームエンジニアリングは、データ駆動型組織における「ドリームチーム」として位置づけられる可能性があります。その役割は、すべてのチームにオブザーバビリティプラクティス(運用データに基づいてシステムを理解する文化)を浸透させ、ソフトウェアエンジニアとSRE(サイト信頼性エンジニア)がツールチェーン(データ収集、分析、デプロイメントなどのツール)についての議論に時間(運用工数データ)を浪費することなく、コード記述と製品リリース(データデプロイメント速度)に全力を尽くせるようにすることです。調査データで全体の4分の3(73%)の回答者がプラットフォームエンジニアリングを導入していると答えている点は、このアプローチが広まっていることを示すものです。専門のチームを作ることは第一歩にすぎず、経営幹部、マネージャー、担当者の賛同(組織全体のデータ文化醸成)を得て、プラットフォームエンジニアリングチームを支援することも重要であることをデータコンサルタントは認識しています。プラットフォームエンジニアリングは、データ駆動型運用と開発の効率化を同時に実現するための重要な取り組みです。
データコンサルタント視点から見るクラウド環境におけるデータの可視化とデータ駆動型コスト管理
データコンサルタントの視点から見ると、データの可視化はクラウド環境におけるコスト管理を適切に制御するための基盤となります。パフォーマンスデータやセキュリティデータに影響を与えることなく、コスト削減のベストプラクティスを実践するためには、まずクラウド環境の運用データ(リソース利用データ、インスタンスデータ、ストレージデータなど)をデータに基づき収集・分析し、コスト発生要因を特定する必要があります。
無駄を特定し、クラウドコストを適切に制御しながら、継続的にデータ管理できるソフトウェアソリューションも提供されています。これらのソリューションは、以下のような方法でコストデータを削減することをデータ分析の観点から支援します。
リソース利用データの分析とインスタンス最適化: 実際のワークロードデータに対して過剰に割り当てられたオーバープロビジョニングされたインスタンスや、需要が低下しているインスタンス(利用率が低いインスタンス)を運用データ分析によって特定します。状況によっては、インスタンスをアップグレードしてパフォーマンスデータ(データ処理速度など)を強化するのが適切な場合もあり、これもデータ分析に基づいたリソース最適化の一環です。
不要なデータ資産・リソースの特定: 古くなったスナップショット(不要なバックアップデータ)、関連付けされていないElastic IPアドレス、アイドル状態のロードバランサーなど、不要になった「ゾンビアセット」や目的を果たし終えたコンポーネントを運用データ(利用状況ログ、構成情報など)の分析によって特定します。これらのデータ資産やリソースは、コストデータが発生し続けるにもかかわらず価値を生み出していないため、特定と削除が重要です。
非本番環境インスタンスのデータ駆動型スケジュール設定: 開発環境やテスト環境といった非本番環境のインスタンスを、アクセスする必要が生じたときにだけ開始/終了するように運用データに基づきスケジュール設定することで、利用していない時間のコストデータ削減を実現できます。ソリューションによっては、過去の利用パターンデータや予測データに基づき、最適な開始/終了のタイミングについて推奨を行うものがあります。
リザーブドインスタンス活用のデータ分析: 一定期間の一定量の使用をデータに基づき確約することで割引を受けられるリザーブドインスタンスを利用できるケースを運用データ分析によって特定します。インスタンスのサイズをデータに基づき適切に調整した後に行うと、高いコスト削減効果が得られます。
不適切なストレージクラスデータの特定とデータ移行: アクセス頻度の低いデータを高性能で高価なストレージに保管しているといった、適切ではないストレージクラスに保存されているデータをデータアクセス頻度やデータ利用パターンに関するデータ分析によって特定します。アクセス頻度の低いデータをAmazon S3 Glacierのような安価なストレージクラスにデータ移行することで、ストレージにかかるコストデータを大幅に削減できます。これは、データのライフサイクル管理とストレージコスト最適化に関するデータ駆動型アプローチです。
AWSクラウドの活用を効果的に進めるには、クラウドのコスト管理を継続的にデータに基づき行えるようにすることが理想的です。取り組みを進めていく過程のあらゆる局面で発生しているコスト(プロジェクトコストデータ、運用コストデータなど)は常に問われるため、そのたびに取り組みを保留したり後戻りすることのないよう、常にコストをデータに基づいて制御しておくことが望ましいと言えます。データに基づいたコスト管理体制を構築することが、クラウド活用の成功とビジネスの迅速な推進に不可欠です。データコンサルタントとして、お客様のクラウド環境におけるデータの可視化を高め、データ駆動型コスト最適化を実現するための戦略策定と実行を支援します。
データコンサルタント視点から見るエンドツーエンドのデータ可視性とクラウド環境におけるデータ駆動型運用
データコンサルタントの視点から見ると、組織が直接所有・運用していない外部運用ネットワークを含む、ネットワーク全体におけるデータフローの可視化は、現代の複雑なIT環境において不可欠です。エンドツーエンドのオブザーバビリティ(システム全体の状態を詳細な運用データに基づいて理解する能力)を実現するためには、コンテナ、パブリッククラウド、分散ネットワークといった近年普及しているテクノロジーが生み出すデータ可視性の難しさを克服する必要があります。リーダー的組織がパブリッククラウド環境(77%)、オンプレミスインフラ(74%)、アプリケーション(71%)といった自社管理範囲のデータ可視化を進めている一方で、組織が所有および運用していないネットワークインフラ(サードパーティAPI、ISPネットワークなど)の可視化は45%にとどまっているという調査データは、この領域におけるデータ可視性のボトルネックを示唆しています。
データ可視性不足への対応策:運用データ収集と分析によるインサイト獲得
このデータ可視性の課題への対応策として、組織が運用するネットワークから生成される運用データだけでなく、組織のユーザーが利用するすべてのアプリケーションおよびサービスに関連するネットワークデータ(トラフィックデータ、接続ログなど)についてもインサイトを提供するツールの導入を推奨します。インフラ自体を直接管理できなくても、サードパーティAPI、ISPネットワーク、BGPといった外部ネットワークにおけるデータ問題(例:データ損失、データ遅延)をデータに基づいて把握するなど、データ可視性を高めることで、パフォーマンス低下といった運用上の問題を特定し、適切に対応できる点を強調します。ただし、その場合、特定のワークロード(データ処理タスク)を他の環境にデータ移行したり、SDN(ソフトウェア定義ネットワーク)を使ってトラフィックデータフローをデータに基づき再ルーティングしたりする必要が生じることもあります。
環境の明確化:データ可視性に関する自己評価フレームワーク
組織のデータ可視性に関する自己評価のためのフレームワークとして、以下の問いかけをデータコンサルタントの視点から提示します。これらの問いに対する回答は、組織のデータ管理、運用効率、コスト管理、セキュリティ、およびガバナンスにおけるデータ可視性の現状をデータに基づいて把握するために役立ちます。
データの可視化ができていますか?
ビジネス上の課題を解決するために、アセットのパフォーマンスメトリックデータ(運用データ)をデータ分析できますか?
コスト配分のために、会社全体で統一されたデータタグ付けポリシー(データガバナンスの一環)をデータ資産に適用していますか?
オンプレミスのインフラストラクチャも含めた、すべてのプライベートクラウドおよびパブリッククラウドの運用データにアクセスできますか?
1つのダッシュボードで、包括的なデータの表示やデータ分析を行えますか?
個別のクラウドサービスまで掘り下げられる、詳細にわたる運用データを取得できていますか?
少なくとも13か月分の履歴運用データが保存されていますか?
移行に適したアセットを特定するために、オンプレミスのコストデータとクラウドのコストデータをデータに基づき比較分析することができますか?
さまざまな視点でデータを表示できるように、カスタムダッシュボード(データ可視化ツール)をデータに基づき作成することができますか?
各ダッシュボードにデータ分析レポートの作成機能はありますか?
現在可視化できる情報(運用データ、コストデータなど)から、今後のITコスト(予測コストデータ)をデータに基づき予測することができますか?
部門、チーム、事業部門など、ビジネスグループごとに運用データをデータ分析できますか?
クラウド環境のデータ可視化がAWSクラウド活用を加速
クラウド環境を明確にデータ可視化できれば、AWSクラウドの活用をデータ駆動で加速させることができます。運用データ分析に基づき、傾向や異常(運用データにおける異常パターン)の発生を把握できるだけでなく、正確にコストをデータに基づき割り当てができるようになり、責任分担を明確化できます。さらに、クラウドのコスト管理の簡素化に加え、パフォーマンス問題(性能データ)とセキュリティ問題(セキュリティイベントデータ)の特定や、クラウドジャーニーを進める上で必要となるデータガバナンスポリシーの基準もデータに基づいて確立することが可能になります。データ可視性は、クラウド環境における運用効率、コスト管理、セキュリティ、およびガバナンスといったデータ管理の側面全体に影響を与えるため、これらの領域でのデータ駆動型意思決定を強化するために不可欠です。データコンサルタントとして、お客様のクラウド環境におけるデータの可視化を高め、データ駆動型運用を実現するための戦略策定と実行を支援します。
データコンサルタント視点から見るデータ駆動型IT運用におけるプラットフォームエンジニアリング、オブザーバビリティ、およびAI活用
データコンサルタントの視点から見ると、プラットフォームエンジニアリングは、組織の競争力に大きく貢献しうる要因です。リーダー的組織の調査データによると、58%が開発者がプラットフォームエンジニアリングを競争上の差別化要因と考えていると回答しており、この認識の重要性を裏付けています。プラットフォームエンジニアリングチームが付加価値をもたらすという認識が広まることで、エンジニアや開発者にとっては、効率データと生産性データ向上という形で価値が認識されており(リーダー的組織の48%が同意する調査データ引用)、経営幹部にとっては、市場投入までの時間データ短縮、技術的負債データ削減、コードの信頼性向上といったビジネス成果データという形で価値がもたらされる点を強調できます。これは、プラットフォームエンジニアリングが、運用データ分析に基づく効率化、開発速度の向上、およびシステム品質向上を通じてデータ駆動型のビジネス成果に貢献することを示唆しています。
オブザーバビリティデータとセキュリティデータの共有による運用改善
オブザーバビリティデータ(システム運用状況の詳細なデータ)とセキュリティデータ(セキュリティイベント、脅威データなど)を共有しデータ統合することが、強力な運用改善成果を生み出します。リーダー的組織の調査データ(約4分の3、73%がワークフロー・ツール統合によるMTTR – 平均修復時間 – の短縮を実施)が示すように、オブザーバリティチームとセキュリティチームの両方が質の高いコンテキストとデータを利用できれば、インシデントの根本原因(問題発生の根本原因データ)をデータに基づきより簡単に特定できます。
ただし、この2つのチームの目標がデータ分析の対象や目的に応じて異なり、その目標が相反する場合もあることを理解し、コラボレーションを段階的に進めることで、チーム間の摩擦をデータに基づき和らげることが可能です。まずは、両方のチームが共通して使用するデータソース(運用ログ、セキュリティログ、構成データなど)とデータ分析ワークフローをデータに基づき洗い出し、最終的にはツールのデータ統合を検討しますが、当面は優先度が高いデータソースをいくつか統合し、それらのデータソースに関連するデータ分析ワークフローを調整するのが最善の方法です。ネットワークチームがこれらすべてのデータにアクセスできるようにすれば、トラブルシューティング(問題解決プロセス)の際に、すべてのチームがさらに多くのコンテキストデータを利用できるようになり、データに基づいた迅速な対応が可能になります。
テレメトリパイプラインのコスト抑制:データ管理戦略としての階層化
テレメトリパイプライン(システムから収集される運用データフロー)のコストを抑制することは、効果的なデータ管理戦略の重要な側面です。データ管理にこだわることは、コスト管理の観点から有効であり、データの収集量、送信方法、送信先をデータに基づき管理すれば、データ準備(ラングリング)にかかるコストデータと運用工数データを節約し、既存のデータからより多くの価値(データ分析によるインサイト、運用改善など)を引き出すことができます。
リーダー的組織は、重要なコスト抑制策としてデータ階層化(運用データ管理技法)を取り入れています。調査データ(57%が取り入れている)が示すように、データの階層化は、メトリクスデータ、ログデータ、トレースデータといったすべての運用データが同じ価値(分析における重要度、利用頻度など)を持つわけではないという考え方に基づいています。そのため、優先度の低いデータ(アクセス頻度が低いデータなど)を低コストのコールドストレージに移動することでコストデータ削減を実現できます。そのデータが必要になったときは、統合分析などの機能を使うことでデータを移動することなく利用できる(データアクセス効率を維持しつつコスト削減)点を強調できます。これは、運用データに関するデータライフサイクル管理とストレージコスト最適化の有効なアプローチです。
AIを活用したアラート疲れ軽減と未知の未知の発見:運用データ分析とAIOps
オブザーバビリティソリューションで生成される過剰なアラートデータ(運用データ分析による問題)が問題になっている現状をデータ分析に基づき提示し、AIと機械学習の活用が有効であることを提言します。調査データ(全体の57%が過剰アラートを問題と回答)が示すように、AIや機械学習を組み込んだツールを使えば、異常の検出(運用データにおける異常パターン)やイベントの相関付け(異なる運用データ間の関連性分析)の精度データと効率データ(分析時間)を向上させて、この問題を緩和できます。リーダー的組織の調査データ(85%がアラートの半数以上をAIや機械学習によって処理)は、AI/ML活用によるアラート処理の普及度を示すものです。AIを組み込んだツールでは、同じインシデントに関連する複数のアラートデータをグループ化したり、高度なデータ分析を適用して、生成されるアラートの量を全体的に抑えるなど、いくつかの方法でノイズ(誤検知アラートなど)を減らすことができます。
AIOps(IT運用におけるAI活用)の主なユースケースの一つであるアラート疲れ軽減に対処することで、根本原因分析の迅速化(問題発生の根本原因データ特定)、未知の未知(事前に想定されていない運用上の問題やセキュリティ脅威)のプロアクティブなデータ検出、または潜在的な問題の予測分析(将来発生しうる運用問題やセキュリティリスクの予測)による顧客側のインシデント防止といった他のデータ駆動型運用改善ユースケースにも焦点を当てることができます。データコンサルタントとして、AI/MLを活用した運用データ分析は、運用効率向上とリスク軽減の両面で組織に貢献できると評価します。