こんにちは、ブレインズテクノロジーの佐々木です。
今回はImpulse V2の特性分析 - 時系列データ編、を説明します。
Impulse V2における特性分析とは、性能の良い異常検知モデルを作成するために対象データの特性を事前に分析する機能です。
性能の良い異常検知モデルを作成する上で、正しく異常ラベルを設定したり、学習データを選択・加工したりすることは重要です。通常のデータ分析であれば、コーディングを含む丹念なデータ整形・可視化を元にこれらの判断を行いますが、Impulseでは特性分析の結果に基づいた推奨の元、画面上から簡単に設定できます。
それゆえ特性分析は、Impulseの一連のオートモデリング機能(特許第6315528号※)の中でも重要な要素です。本記事では、特性分析の内容・活用方法について解説します。
※異常検知モデル構築装置、 異常検知モデル構築方法及びプログラム
特性分析では内部的に大きく以下の分析を行っています。
今回は、「クラスタリング」と「セグメンテーション」について解説します。
クラスタリングはデータ点同士の距離を元に、行(時間軸)方向の分離を行います。
Impulseの特性分析では、異常時のデータは正常時から大きく外れているだろうという前提の元、他のグループとの距離が遠いグループのデータを不適切なデータの候補として提示します。画像では、白飛びなど、時系列データでは設備停止期間のデータなど、分析の対象外とすべきものの抽出に用います。
時系列データにおけるセグメンテーションは、カラム(測定項目)方向の分離を行います。
Impulseの特性分析では、複数の測定項目が互いに相関関係である場合、その関係が崩れた時に異常となるケースを想定し、相関係数に基づくカラムのグルーピングの結果を提示します。また、異常ラベルに対する分析を行い、寄与率の大きもの(該当カラム群の値が〜だと異常である可能性が高い)を抽出できます。
ここでは、特性分析結果の具体的な活用方法について解説します。
時系列分析では、主にセグメンテーションの結果に基づいて学習に使用するカラムの選択します。
学習実行画面の「カラム選択」をクリックすると、
互いに相関の強いグループ
異常に対する寄与率が高いグループ
不適切なカラムを除いたグループ
が推奨として現れます。これらの推奨結果を元にカラムを選択することで、
不必要なカラムやノイズの少ない良い学習データが得られることを期待できます。
また事前知識がある場合は、特性分析の結果と合わせて判断し、個別に設定することもできます。
学習実行画面に、円グラフとしてクラスタリングの結果が表示されます。(詳細はマニュアルを参照)
示唆されています。必要に応じて、ラベルタブからラベル情報の設定を行います。
まとめ
Impulseの特性分析では、今回紹介しなかった
アノテーション
リゾルーション
ソルーション
などの分析も行っており、APIなどから結果の取得が可能です。
また画面との連携や学習パラメータとの連携などが開発ロードマップにあり、今後益々パワーアップしていく予定です。