「入門 監視」読書会レポート vol.9

株式会社リゾーム システム企画・開発部 システム管理のあめぎです。

入門監視 読書会の第9回目のレポートです。 第8回目のレポートは、こちらになります。

tech.rhizome-e.com

9回目レポート

今回は、「9章 ネットワーク監視」で、参加者は6名でした。

感想・意見交換

SNMP のつらさ

  • SNMPはセキュアではないプロトコルらしい
    • 古いけど代替がなく使わざるを得ないケースがあるらしい
    • 大変そうだ
  • バイスが高負荷の時にはSNMPのエージェントの処理の優先度を下げる
    • 一番知りたい時に情報が分からないらしい
      • これ本当に使えるの?理解できるが納得できない…!
  • SNMPv3では暗号化やユーザベースのセキュリティモデルを適用
    • 基本はv3使えば良さそう
      • 負荷が増えたりサポートされていなかったりするので注意
    • 2002年に発表されたバージョン3を未だにサポートしていないベンダーも多いというのは辛い
  • ネットワーク機器の監視(主に物理)をするには使っておいた方がいいのかな
    • ハードウェア故障はめちゃくちゃ心臓に悪い ※経験談
  • OIDだと読みにくく分からないのでMIBを使って変換するらしい
    • DNSみたいな感じかな
    • 利用ハードルが高く感じる
      • 各ベンダからMIBを入手する
      • 必要に応じて最新のものを入手する
      • 最新にしたことによる影響は自分で調べる
  • インターフェイスのメトリクス
    • 帯域幅(bandwidth) ⇒ 理論値
    • スループット(throughput) ⇒ 実測値
    • レイテンシ(latency) ⇒ かかる時間
      • オンラインゲームしていると気になるよね
    • ジッタ(jitter) ⇒ バラつき
      • Teamsとか音声アプリだと気になるよね

構成管理

  • この辺りの考え方はネットワークでも変わらなそう
    • Git や Ansible なんかも同じ
    • ロールバックしたときの影響を考える必要があるような
  • ネットワーク機器こそ構成管理ツール使いたいよなぁと思う
    • ルーティングテーブルの設計とかめちゃ気を遣う
    • なかった時はメモ帳で残してたなぁ
  • ネットワークデバイスの構成管理としてRANCIDが例として上がっていた

音声と映像

  • QoSCCNPの勉強してた頃に出てきた
    • ストリーミング系の通信の優先順位を高くしてある程度の品質を保つとか
  • 監視の要素としてはレイテンシ・ジッタ・パケットロスが全て
    • もう1つ特に監視すべきことはコーデック

ルーティングプロトコル

  • ルーティングテーブルの設定はあってもデータが流れるかどうか見ないといかん
    • ping打ったりtracerouteして予定通りの経路通ってるか確認してた
    • このあたりはSNMPで見れるのか
  • ダイナミックルーティングプロトコルを監視しておくと便利
    • 動的なものは通知してくれないとわからないものな
  • BGPって何だ...って思ってたら打合せで出てきた
    • 「異なるAS間で経路情報をやり取りするときに使うルーティングプロトコル」だった
  • BGPの監視項目について
    • シャーシのメモリ容量
      • メモリ使い切ったら処理止まるからか
    • BGPピアの変更
      • 変わったのは気になるものなんだろうな
    • ASパスの変更
      • 経路変わったら気になるものなんだろうな

スパニングツリープロトコル

  • ブロードキャストストームが起きないようにする
  • ルートブリッジの変更を監視
    • なんで?誰が変えたの?というのは気になるものなんだろうな

本体の監視

  • アプリ性能はネットワーク性能を超えられない
  • CPUとメモリはカード単位で持っている場合もあるので注意という事らしい
  • CPUとメモリは他の章と同様メトリクスは取れる
    • でもアラートはしないでよさそう
  • ハードウェアの監視こそ大事…再起動繰り返してたりとか…
    • まぁ大体はベンダが監視ツールを準備しているとは思う
  • CPUとメモリの使用率からアラートを送信するのはやめておいた方がいい
    • これはOSメトリクスの監視と同じかな

フロー監視

  • sFlow, IPFIX, NewFlowなどがある
    • 帯域幅を大きく使っている活動やノードの監視・分析する
  • フローがわかれば帯域確保の優先順位とか変わるかなと思うのでよさそう
  • AWSVPC Flow Logs でみれたはず

キャパシティプランニング

  • 必要なキャパシティを予測する時は過去のデータを活用する
    • 未来を予想できるのは過去を知っている人だって誰かが言ってた…!
  • フロー監視がキャパシティプランニングに関係あるのかな?と思った

疑問・質問

  • 「この辺りの話が分かると変更時や障害発生時に嬉しい」ということがあれば知りたい
    • いつ どこから(送信元) どこへ(送信先) 何をしようとしたか(ポート・プロトコル等)が大事
  • AWSを使う上で必要な知識は?

難解なネットワーク章・参加者の心の叫び

  • 正直お世話になった事がない…
  • インフラ屋さんじゃないしあまりピンとこない…
  • ネットワークの用語を勉強しないと理解出来そうにない章
  • ちゃんとやろうと思ったら専業のネットワークエンジニアじゃないと無理じゃないかな
    • 最近はインフラもクラウド化したり仮想化したりしている
  • 知らないことすぎてなるほど...になってる
  • ネットワークについて知識が乏しすぎる
    • やっと「3分間ネットワーク基礎講座」を読み始めた

漂う重い空気・気分転換として

  • 参加者の好きなおにぎりの具
  • この後すれ違った社員にも聞いたら「昆布」って言われました。人気ですね。

まとめ

今回のネットワーク章は、自分のレベルに合わせて調べたり、学習したりと各々課題を見つけ取り組んでいくものになったかと思います。 勉強会では今回の様な難しい章も出てきますが、楽しく前向きに進めています。

次回は「10章 セキュリティ監視」です。