有沒有辦法在網路故障時啟動故障保存網路配置?

有沒有辦法在網路故障時啟動故障保存網路配置?

問題

遠端變更網路設定時,網路是否有辦法在發生故障時嘗試使用不同的設定檔?

背景- 太長了;

我一直在四處尋找,但我並沒有真正看到任何關於將文件傳遞給 ifup 之類的事情的參考,儘管這讓我想到了檢查 ifup 的手冊頁,但無論如何。我現在無法測試。

我們的伺服器已移至資料中心,而我在另一個城市工作。網路不是我的強項,安裝後我想將兩個網卡綁定在一起以提高吞吐量。但這樣做時,由於網路介面初始化失敗,我失去了連線。

我曾經嘗試在 /etc/sysconfig/network-scripts 中設定綁定

bond0:採用 eth0 和 eth1 eth0:設定為綁定 eth1:設定為綁定,然後 eth1:1 認為我可以將 ip 綁定到它,以防萬一我再次被封鎖......

不幸的是,這不起作用,唯一有資格去資料中心提供支援的人是我的老闆。情況不太好。 (我在虛擬伺服器上測試了兩次,只是為了確保我不會失去連線)

現在,我們已經將其綁定,但據我所知,無法進行“以防萬一”配置...

因此,今天我需要橋接伺服器內虛擬機的連接…你瞧,我再次失去了連接,這是我的老闆本月第二次前往資料中心。 :摀臉:

一定有一種方法,如果接口沒有被檢測到,網絡將使用一組完全不同的配置文件,一個故障保護,如果你願意的話,這樣在失敗的網絡嘗試之後,每五個運行一個 cron 作業如果網絡出現故障,幾分鐘後即可重新建立與故障保護的網路連線。

我希望現在就可以存取 Linux 機器,但我通常會透過執行服務網路重新啟動命令來檢查網路。有沒有辦法給它一個故障安全命令,如果未檢測到網絡,它將依次嘗試不同的故障安全配置,直到它啟動。

答案1

tl;dr:使用 OOB,查看組態管理,否則您需要建立自己的解決方案。

我不熟悉 linux 領域中預先建立的任何東西來執行此類操作 - IPMI/ILOM/OOB 通常是可行的方法。您不僅可以透過遠端控制台存取主機,還可以(通常)檢查硬體的狀態,如果硬鎖定則發出遠端重新啟動等。

如果 OOB 不是一個選項,您可以考慮設定 cron 作業來檢查各種情況並確定您的主機是否處於無法存取的狀態,並執行任務以嘗試自行復原。

當然,這存在很大的風險。您必須考慮很多不同的場景 - 假設您想檢查以確保可以存取您的網關 IP 位址,但您的網關短暫消失 - 如果不是問題,您不希望主機重新配置其介面與您的盒子,但上游的東西。

還有設定管理控制選項,您可以將其設定為將本機電腦還原為預期狀態/每小時驗證其處於預期狀態等 - 您必須將這些應用程式設定為使用設定檔的本機副本,而不是比嘗試與遠端伺服器對話,但這是可能的。這可能有點太多,具體取決於您管理的系統數量(如果超過 5 個,我強烈建議您研究一下組態管理,這將節省您很多時間)。

如果您確實想在盒子監視器上使用一些腳本進行更改,我強烈建議您將其設置為試運行模式相當長一段時間。這樣,您就可以在它認為需要重新配置網路介面時記錄它,從而允許您在將其投入使用之前調試/測試/健全性檢查功能。

更好的是,您可以在主機上連接第二個或第三個介面(因為您想要綁定),並且永遠不要觸及該介面配置,或者讓您的腳本僅嘗試使用該介面將自身恢復為服務- 這樣,如果它變得混亂,它不會潛在地破壞它認為不好的接口,而只是您僅用於此目的的第三個接口。

相關內容