株式会社リゾーム システム企画・開発部 システム管理のあめぎです。
入門監視 読書会の第9回目のレポートです。 第8回目のレポートは、こちらになります。
9回目レポート
今回は、「9章 ネットワーク監視」で、参加者は6名でした。
感想・意見交換
SNMP のつらさ
- SNMPはセキュアではないプロトコルらしい
- 古いけど代替がなく使わざるを得ないケースがあるらしい
- 大変そうだ
- デバイスが高負荷の時にはSNMPのエージェントの処理の優先度を下げる
- 一番知りたい時に情報が分からないらしい
- これ本当に使えるの?理解できるが納得できない…!
- 一番知りたい時に情報が分からないらしい
- SNMPv3では暗号化やユーザベースのセキュリティモデルを適用
- 基本はv3使えば良さそう
- 負荷が増えたりサポートされていなかったりするので注意
- 2002年に発表されたバージョン3を未だにサポートしていないベンダーも多いというのは辛い
- 基本はv3使えば良さそう
- ネットワーク機器の監視(主に物理)をするには使っておいた方がいいのかな
- ハードウェア故障はめちゃくちゃ心臓に悪い ※経験談
- OIDだと読みにくく分からないのでMIBを使って変換するらしい
- DNSみたいな感じかな
- 利用ハードルが高く感じる
- 各ベンダからMIBを入手する
- 必要に応じて最新のものを入手する
- 最新にしたことによる影響は自分で調べる
- インターフェイスのメトリクス
構成管理
- この辺りの考え方はネットワークでも変わらなそう
- Git や Ansible なんかも同じ
- ロールバックしたときの影響を考える必要があるような
- ネットワーク機器こそ構成管理ツール使いたいよなぁと思う
- ルーティングテーブルの設計とかめちゃ気を遣う
- なかった時はメモ帳で残してたなぁ
- ネットワークデバイスの構成管理としてRANCIDが例として上がっていた
- AnsibleでもNetworkモジュールがあるので同じことが出来そう
- https://docs.ansible.com/ansible/2.9_ja/network/index.html
音声と映像
- QoSはCCNPの勉強してた頃に出てきた
- ストリーミング系の通信の優先順位を高くしてある程度の品質を保つとか
- 監視の要素としてはレイテンシ・ジッタ・パケットロスが全て
- もう1つ特に監視すべきことはコーデック
ルーティングプロトコル
- ルーティングテーブルの設定はあってもデータが流れるかどうか見ないといかん
- ダイナミックルーティングプロトコルを監視しておくと便利
- 動的なものは通知してくれないとわからないものな
- BGPって何だ...って思ってたら打合せで出てきた
- 「異なるAS間で経路情報をやり取りするときに使うルーティングプロトコル」だった
- BGPの監視項目について
- シャーシのメモリ容量
- メモリ使い切ったら処理止まるからか
- BGPピアの変更
- 変わったのは気になるものなんだろうな
- ASパスの変更
- 経路変わったら気になるものなんだろうな
- シャーシのメモリ容量
スパニングツリープロトコル
- ブロードキャストストームが起きないようにする
- ルートブリッジの変更を監視
- なんで?誰が変えたの?というのは気になるものなんだろうな
本体の監視
- アプリ性能はネットワーク性能を超えられない
- CPUとメモリはカード単位で持っている場合もあるので注意という事らしい
- CPUとメモリは他の章と同様メトリクスは取れる
- でもアラートはしないでよさそう
- ハードウェアの監視こそ大事…再起動繰り返してたりとか…
- まぁ大体はベンダが監視ツールを準備しているとは思う
- CPUとメモリの使用率からアラートを送信するのはやめておいた方がいい
- これはOSメトリクスの監視と同じかな
フロー監視
- sFlow, IPFIX, NewFlowなどがある
- 帯域幅を大きく使っている活動やノードの監視・分析する
- フローがわかれば帯域確保の優先順位とか変わるかなと思うのでよさそう
- AWS は VPC Flow Logs でみれたはず
キャパシティプランニング
- 必要なキャパシティを予測する時は過去のデータを活用する
- 未来を予想できるのは過去を知っている人だって誰かが言ってた…!
- フロー監視がキャパシティプランニングに関係あるのかな?と思った
疑問・質問
- 「この辺りの話が分かると変更時や障害発生時に嬉しい」ということがあれば知りたい
- AWSを使う上で必要な知識は?
難解なネットワーク章・参加者の心の叫び
- 正直お世話になった事がない…
- インフラ屋さんじゃないしあまりピンとこない…
- ネットワークの用語を勉強しないと理解出来そうにない章
- New Relicでネットワーク監視出来そう
- https://docs.newrelic.com/jp/docs/network-performance-monito...
- ちゃんとやろうと思ったら専業のネットワークエンジニアじゃないと無理じゃないかな
- 最近はインフラもクラウド化したり仮想化したりしている
- 知らないことすぎてなるほど...になってる
- ネットワークについて知識が乏しすぎる
- やっと「3分間ネットワーク基礎講座」を読み始めた
漂う重い空気・気分転換として
- 参加者の好きなおにぎりの具
- この後すれ違った社員にも聞いたら「昆布」って言われました。人気ですね。
まとめ
今回のネットワーク章は、自分のレベルに合わせて調べたり、学習したりと各々課題を見つけ取り組んでいくものになったかと思います。 勉強会では今回の様な難しい章も出てきますが、楽しく前向きに進めています。
次回は「10章 セキュリティ監視」です。