Impulse V2 モデル作成講座:特性分析で何がわかる?- 時系列データ編

作成者: brains_sasaki|May 24, 2021 1:45:43 AM

こんにちは、ブレインズテクノロジーの佐々木です。
今回はImpulse V2の特性分析 - 時系列データ編、を説明します。

Impulse V2の特性分析とは?

Impulse V2における特性分析とは、性能の良い異常検知モデルを作成するために対象データの特性を事前に分析する機能です。

性能の良い異常検知モデルを作成する上で、正しく異常ラベルを設定したり、学習データを選択・加工したりすることは重要です。通常のデータ分析であれば、コーディングを含む丹念なデータ整形・可視化を元にこれらの判断を行いますが、Impulseでは特性分析の結果に基づいた推奨の元、画面上から簡単に設定できます。

それゆえ特性分析は、Impulseの一連のオートモデリング機能(特許第6315528号※)の中でも重要な要素です。本記事では、特性分析の内容・活用方法について解説します。

※異常検知モデル構築装置、 異常検知モデル構築方法及びプログラム

分析内容

 

特性分析では内部的に大きく以下の分析を行っています。

  • クラスタリング
  • セグメンテーション
  • アノテーション
  • リゾルーション
  • ソルーション

今回は、「クラスタリング」と「セグメンテーション」について解説します。

クラスタリング

クラスタリングはデータ点同士の距離を元に、行(時間軸)方向の分離を行います。

Impulseの特性分析では、異常時のデータは正常時から大きく外れているだろうという前提の元、他のグループとの距離が遠いグループのデータを不適切なデータの候補として提示します。画像では、白飛びなど、時系列データでは設備停止期間のデータなど、分析の対象外とすべきものの抽出に用います。

セグメンテーション

時系列データにおけるセグメンテーションは、カラム(測定項目)方向の分離を行います。
Impulseの特性分析では、複数の測定項目が互いに相関関係である場合、その関係が崩れた時に異常となるケースを想定し、相関係数に基づくカラムのグルーピングの結果を提示します。また、異常ラベルに対する分析を行い、寄与率の大きもの(該当カラム群の値が〜だと異常である可能性が高い)を抽出できます。

活用方法

 

ここでは、特性分析結果の具体的な活用方法について解説します。

学習に使用するカラムの選択

時系列分析では、主にセグメンテーションの結果に基づいて学習に使用するカラムの選択します。

学習実行画面の「カラム選択」をクリックすると、

  • 互いに相関の強いグループ

  • 異常に対する寄与率が高いグループ

  • 不適切なカラムを除いたグループ

が推奨として現れます。これらの推奨結果を元にカラムを選択することで、

不必要なカラムやノイズの少ない良い学習データが得られることを期待できます。

また事前知識がある場合は、特性分析の結果と合わせて判断し、個別に設定することもできます。

学習時に使用するラベル情報の付与

学習実行画面に、円グラフとしてクラスタリングの結果が表示されます。(詳細はマニュアルを参照)

  • 「適合(異常スコアが高い)」が多い場合は異常ラベルのつけ逃しが、
  • 「不適合(異常スコアが低い)」が多い場合は異常ラベルのつけすぎが、

示唆されています。必要に応じて、ラベルタブからラベル情報の設定を行います。

まとめ

Impulseの特性分析では、今回紹介しなかった

  • アノテーション

  • リゾルーション

  • ソルーション

などの分析も行っており、APIなどから結果の取得が可能です。

また画面との連携や学習パラメータとの連携などが開発ロードマップにあり、今後益々パワーアップしていく予定です。