db tech showcase

dbtsブログ

このエントリーをはてなブックマークに追加

【dbts2025 レポート】“見張る”から“理解する”へ、DB監視に可観測性を加える意味 〜問題の本質を捉えるための視点と運用の変化〜

テクノロジー 初心者向け 運用ノウハウ
【dbts2025 レポート】“見張る”から“理解する”へ、DB監視に可観測性を加える意味 〜問題の本質を捉えるための視点と運用の変化〜

こんにちは、プロダクト開発本部の小浦方です。
db tech showcase 2025 2日目のD12のセッションである「“見張る”から“理解する”へ、DB監視に可観測性を加える意味 〜問題の本質を捉えるための視点と運用の変化〜」のレポートをお届けします。

セッション概要

従来のデータベース監視は、CPUなどの各種リソース使用状況、アラート通知などに注目した“見張る”運用が中心でした。しかし、実際に障害や性能劣化が発生した際に「なぜ起きたのか」「どこで発生したのか」を把握するのは容易ではありません。
本セッションでは、監視だけでは捉えきれない問題の構造や背景を理解するために、“可観測性”という視点を加える意味とその利点を解説します。オンプレミスやマルチクラウドなど多様な環境においても活用できる、より深いデータベース運用のアプローチをご紹介します。

スピーカー名:
日本エクセム株式会社
エンジニアリング部 
中川 森仁 様

概要

最初にセッションのゴールとして、以下の3つが理解できること、と提示されました:

  • 従来の監視と可観測性の違い
  • 可観測性がなぜトラブル解決に役立つのか
  • データベースにおける可観測性の必要性

全体の流れとしては、前半は従来のシステム監視とその限界について述べられ、後半は従来の監視の課題を解決するために「可観測性」という視点を導入し、DBにおける応用例の紹介がありました。

前半のシステム監視とその限界の話では、現場で感じるよくある課題として「データベースのプロセスは動いているのに、DBが『使えない』ことがある」と「特定のSQLの処理時間が突然遅くなった」が挙げられました。これらのトラブルが解決できない原因として、従来の監視が「メトリック」や「プロセスの状態」を定期的にチェックする、いわゆる“見張る”運用にとどまっている点が指摘され、トラブルの原因特定や深堀り限界があると述べられました。「通知」には有効だが『理解』には不十分な従来の監視の課題に応えるアプローチとして、『可観測性』の考え方の紹介に進みました。
可観測性についての話では、データベースの可観測性とは「どのような状況でもデータベースの状態を正確に理解し、説明することができることの取り組み」であるとし、具体的には:

  • データベースから多種多様なデータを収集する
  • 収集したデータを様々な手法で分析してデータベース内部の状態を説明する

と述べられました。

可観測性をDBに応用する話では、データベースを内部レイヤー構造を上位から「SQL(アプリ)層」「データベース層」「OS/HW層」で分けたとき、従来の監視では上位レイヤーほど情報が少ないことが述べられました。「可観測性」の場合は上位レイヤーの情報も収集することで、判断がアプリ層・ユーザ層に近づき、結果だけでなくその原因(コンテキストや因果関係)を掘り下げることが可能になると説明されました。

まとめ

最後にまとめとして以下が挙げられました:

  • 従来の監視では、『何が起きているか』までは見えても、『なぜ起きたか』までは分からない
  • 可観測性は、コンテキストや因果関係を捉え、『理解できる運用』を実現
  • 可観測性を取り入れて、データベース運用のレベルを一段引き上げましょう

聴講した感想

自分たちの製品が導入されたお客様の環境でトラブルが起きたとき、その迅速な解決のためには事前にどれだけ備えておけるかが重要です。具体的には、原因分析に必要な情報が製品ログに出せているか、製品ログ以外にお客様からいただくべきシステム情報に関する知見が蓄えられているか、等です。今回の「可観測性」についてのセッションは、製品及びそのログの設計、そして製品サポートの方法について、とても参考になるお話でした。

一覧に戻る