dbtsブログ

2019年10月30日

【dbts2019セッションレポート】時系列データを「まとめて」異常検知する

AI／BI(データ分析)

こんにちは！インサイトテクノロジーマーケティング本部です。

IoTセンサーデータなど大量の時系列データが日々蓄積され続けるようになり、時系列データに対する分析や異常検知の需要が高まっています。この課題において、弊社プロダクト開発本部の小浦方が「時系列データを「まとめて」異常検知する」のセッションで、複数の時系列データ(多変量)に対しての異常検知について、理論展開、適用性、そして今後の可能性について解説しました。

こちらのレポートで、一部弊社社員のコメント・感想をまとめさせていただきたいと思います。現実の世界では、個別の時系列データとしては正常の範囲でも、複数の時系列データを「まとめて」見ることで識別できる異常も存在しますので、その背景にある理論や仕組みに興味がございましたら、ぜひ文末の「関連セッション」のリンクより講演資料をダウンロードしてご一読ください。

笹谷：非数学系の聴衆のことも考えた良いセッションだ

昨年までの異常検知を発展させたセッション（単変量 -> 多変量）、という認識で聴講しました。数式はともかく、どういった登場人物で成り立たせている手法なのか、といった「気持ち」の部分を入れ込んでもらえているので、厳密な理解には及ばずとも、理屈が腑に落ちるような構成になっており、非数学系の聴衆のことも考えた良いセッションだなあと感じました。製品に取り込むためには、想定顧客の規模と、それに応じたアーキテクチャについて、ある程度しっかり考える必要があるなとも思っていました。

澤田：「変数の組み合わせ」から異常を検知することが望まれることを理解した

数10～100の変数から異常を見つける場合には、それぞれの変数を単体で見るのではなく、「変数の組み合わせ」から異常を検知することが望まれることを理解しました。異常データを用意することが現実的に難しいことも多いことから、教師なし学習による異常検知が多いようです。今回は複数の変数にも教師なし学習を使い、異常を検知するだけでなく「どの変数が異常か」が分かること、ノイズがあるような現実的なデータにも応用できることを目的とした異常検知の手法について紹介されていて、非常に勉強になりました。

題材上、数式や用語の紹介が駆け足だったためすべてを追いかけるのは不可能というかなかなか難しかったと思いましたが、聴講者のレベルを見極めたうえでのこうした用語紹介の取捨選択も難しいものですね！

大橋：機械学習は世の中を変えるポテンシャルがある楽しみな分野だ

正直詳しい内容を理解するまでには至らなかったが、機械学習(疎構造学習)の内部的にどのようなことを行っているのかということを、少しイメージできるようになれたのが有益だったと思います。機械学習に関してはこれからどんどん発展していき、世の中を変えるポテンシャルがあると思うので楽しみな分野でもありますね。わかりやすく例を混ぜて説明した場面もあるので良いのですが、専門用語の説明が多かったため途中から理解できずにデモまで進んでしまった感じもあるので、素人にはちょっとむずかしい内容のセッションだなと思いました。

一覧に戻る