
私たちのネットワークは、古くて信頼できる Cisco スイッチを中核としています。このスイッチはいつダウンしてもおかしくないという直感があります。これは次のようなインフラストラクチャであるため、それは危機を意味します。
彼らは単一障害点のみで構築することに成功しました。冗長性が多少は入っていると思うかもしれませんが、
ネットワーク ハードウェアの平均寿命を示す統計データを探しています。私の主張を裏付ける確かなデータが必要です。
もしこれが役に立つなら、最も古い Cisco は 3500XL ファミリーのものです。そのうちのいくつかは数年前に短期間で故障しました。
答え1
直接的な答えではありませんが、
失敗しているように聞こえますか? 馬鹿げているように思えるかもしれませんが、古いスイッチには、本当にひどい音を出すファンが付いている可能性があり、それが「これを聞いてみなさい」という強い主張になります。
妥協、コールドスペア:
また、これに対する別のアプローチとしては、ダウンタイムは完全な冗長性を実装する価値がないが、コストはどうなのかという議論があります。シングルスイッチラックに載せてコールドスペアこうすれば、もし失敗したとしても、回復時間時間は大幅に短縮されます。
Joel Spolsky は、stackoverflow のポッドキャストの 1 つで、「ダウンの頻度よりも回復時間の方が重要です」というようなことを言っていました。私の記憶では、数分で復旧できる場合はダウンタイムはそれほど大きな問題ではありませんが、半日復旧しない場合は大きな問題になるという議論です。私の意見では、これは賢い見方だと思います。
だからあなたの新しい議論は、スイッチはそれコールド スペアは高価ですが、少なくとも 1 つのコールド スペアを用意しておくと、ダウン時間が丸一日ではなく数分になる可能性があるため、企業にとってコスト効率が高くなります。
また、この方法で議論に勝った場合は、必ずコールド スペアを事前に構成してください ;-)
答え2
まず、ネットワークに冗長性を追加すると、ネットワークは大幅に複雑になり、何をしているのかわかっていなければ、信頼性が向上することはないかもしれないということを言っておきます。運に恵まれるのは、時には良い計画です。最善の計画ではありませんが、小切手を切る人にとっては、最善の方法のように思えるかもしれません。
あなたは、これらのものを 2、3 個だけではなく、不安定な山全体を持っていると仮定します。
予備品を入手するという Kyle の提案の延長として、いくつかのデバイスをアップグレードし (交換用デバイスを vrrp / hsrp 冗長構成にする)、サービスから外したデバイスを、まだサービス中のデバイスの予備品として使用するために取っておくというのはどうでしょうか。
また、彼らはするすべてのデバイスのすべての構成のバックアップを持っていますか? それが最優先事項です。緊急時には、L2 / L3 デバイスを別のデバイスに置き換えることができますが、それは、古いデバイスが故障する直前に何をしていたかを知っている場合に限ります。