
現在の Linux の任意のバージョン、R8169 ネットワークが組み込まれた Intel NUC、およびテスト済みの外部 USB ネットワーク アダプター。
インターフェースは、ログにエラーが記録されずに、ランダムに送信/受信を停止します。
ifconfig では、インターフェースがまだアクティブで接続されていると表示されます。RJ45 のライトはまだ点滅しています。
別のマシンから ping を実行すると、接続が切断されることが分かりました。その時点で、接続が切断されたことがわかります。影響を受けたマシンから ping を送信することで、接続を回復できることが分かりました。数秒間停止してから、ping が正常に開始されます。しかし、数分後には再び接続が切断されます。
ログには何も明白なことはありません。実際、上下に動くので、ログはありません...
マシン上で tcpdump を実行したところ、ネットワーク トラフィックを確認できますか? DNS クエリと ARP 応答も確認できます。
私が確実に知っていることは、影響を受けたマシンから開始した場合にのみ通信が再開されるということです。ルートはなく、フラット ネットワークと 1GB のネットギア非管理スイッチだけです。
route と入力してネットワークが動作している場合は、即座に応答が返されます。問題が発生すると、コマンド route の応答に 10 ~ 15 秒かかりますが、リストは同じです。
ネットワーク ケーブルを抜いて再接続すると問題は解決しますが、数分後に再び発生します。
もう1年以上もこのことで私は気が狂いそうになっています。
*編集
問題が発生すると何が起こるかが分かりました。マシンから ARP 要求が送信され、インターネット ルーターの IP アドレスである _gateway を持っているのは誰かを尋ねます。今のところ、デフォルト ルートを削除して、ルーターが応答しないことがネットワークのハングの原因であるかどうかを確認します。これは NUC 上の Linux だけでしょうか?
*編集
デフォルト ルートを削除しても問題は解決されません。
答え1
問題が見つかったようです。ネットワーク上には Alexa、Kindle、Fire Stick などの Amazon デバイスがあります。別のマシンから tcpdump を見ると、このことが示されていたので、そのうちの 1 つがこのマシンと同じアドレスを使用しているに違いありません。
22:53:37.332273 ARP、応答 192.168.1.100 は b8:ae:ed:7d:e4:78 です、長さ 46
22:53:37.669633 ARP、応答 192.168.1.100 は fc:a6:67:c3:03:8d にあります、長さ 46
2 つのデバイスが同じアドレスに返信する