私は 3 晩と数日を費やして、突然動作しなくなった 2 台の nfs vers=3 サーバーがあるホーム ネットワークのサーバーを Google で検索して再構成しました。
3~4 台のクライアントから自動マウントを使用しても、まったく問題なく動作していました。これは生産的ではありません。自宅にテスト用などとして置いていますが、写真や動画などが 1 台または別のサーバーの ZFS 上に保存されています。
突然何も機能しなくなり、進展もありませんでした。rm /etc/default/nfs-* apt-get purge&install も、rpc.mountd または statd を起動してその出力を確認するさまざまな試みも、何の成果も得られませんでした。しかし、nfs3 サーバーを備えた 3 台目のマシンがあり、OpenWRT を備えたルーターは USB キーのみを提供します。このマシンは、2 台の Ubuntu サーバーが停止しているにもかかわらず、すべての PC で問題なく動作します。そのため、Ubuntu のアップデートを疑いました。数か月前に nfs-utils パッケージが削除されているのを見つけました。そして、いつ動作しなくなったのかはわかりませんでした。
症状: showmount -e server は答えを表示するのに 2 ~ 3 分かかりますが、答えは正しいです。rpcinfo -p server は約 1 分以上かかりますが、正しい出力が表示されます。mount.nfs xx:/x/x /mnt/test -o vers=3 は 1 ~ 2 分後にエラーで終了します。これらのサーバーの ping または mount samba は問題なく動作し、iperf は予想どおり約 1 ギガビット (クライアントが Wi-Fi を使用している場合はそれ以下でも問題ありません) を示します。ポートマッパー ポートと nfs ポートに telnet するとセッションが開きます。ファイアウォールはオフです。Hosts.allow に ALL:lanip も追加しました。- すべての問題は Ubuntu サーバーにのみ関係し、OpenWrt は数秒で応答し、すべてのクライアントから期待どおりに動作します。ただし、nfs4 はサポートされていません。- サーバーの 1 つは Trusty HWE スタックを備えた 12.04.5 LTS です。- 2 つ目のサーバーは 14.04 LTS Trusty です。すべての更新プログラムがインストールされています。そのうちの 1 つは 2 つのインターフェースの NIC ボンディング (mode0) を使用しますが、もう 1 つは使用しません。
説明なしの理由:
長い話を少し短くすると、数分前に試してみようという突飛なアイデアが浮かび、新しい ZyXel GS1900-8 マネージド スイッチを、古い安価な (ただしギガビット) tplink に交換しました。すると、その瞬間に NFS サーバーが動作し始めたので、私は気が狂いそうになりました。
スイッチをじっと見つめても、何がおかしいのかわかりません。今思い出したのは、LLTP を有効にして、すべての PC に lltpd をインストールしたことです。ポート リストに PC の名前が表示されるのが楽しみだったからです。また、古いスイッチではサポートされておらず、新しいスイッチでは動作している 803.ad LACP を使用してボンディングのテストをいくつか行いました。ただし、これは定期的に使用していて必要だと考えている WoL を回避するため、オフにしました (モード 0 に戻しました)。
何をチェックすればよいか教えてください。または、原因を推測してください。どこを見て、どのようなコマンドを実行して違いを見つければよいですか? とても興味があります。
答え1
最終的には、DoS (サービス拒否) 機能が有効になっている管理対象スイッチが SYN<1024 ポートマップ要求を検出し、それらをブロックし始めることがわかりました。この機能をオフにすると、問題は完全に解決されます。
telnet のみを試した場合、すべてのポートにアクセスできるため、rpcinfo -p または showmount -e を試さない限り、問題を検出できません。
Googleは、私が検索すべきものをすでに知っているのに、一般的なメッセージを見つけました。https://serverfault.com/questions/367107/cant-mount-nfs-share-over-tcp また、さまざまなブランドのスイッチが言及されています (私のは ZyXel、PoweConnect、そして Cisco です)。
私の意見では、マネージド スイッチが安価で一般的になるにつれて、この問題が何度も再発する可能性があります。おそらく、askubuntu で言及されている別の NFS の問題の原因です。