Kubernetesの監視にPrometheusを使用する理由とその方法(前半)

gavin.zhou
Jul 6, 2023

Kubernetesの監視にPrometheusを使用する理由とその方法についての記事です。長い記事なので、前半と後半の2つに分けて投稿いたします。今回は前半です。

ZipRecruiterのIcingaとGraphiteからクラウドネイティブなオープンソースモニタリングへの道のり

Site Reliability Engineer(SRE,サイト信頼性エンジニアリングや)その他のオペレーターは、システムが健全に機能していることを確認するために常に監視しています。これは、ノートパソコンの画面をちらっと見て電源が入っているかどうかを確認するような簡単なものから、メインのビジネスシステムと一緒に全く別の分散型監視システムを稼働させるような複雑なものまであります。

Icingaは、ZipRecruiter も含め、他のモニタリングサービスは10年以上にわたって組織に素晴らしいサービスを提供してきました。Icingaは、そんな監視システムの1つです。しかし、本番サービス(開発・ステージング環境も含む)をKubernetes(K8s)に移行したことで、Icingaはもはや監視のためのベストな選択ではなくなりました。

--

--