NFS-сервер не отвечает клиентам, процессы «миграция» и «xfssyncd» потребляют необычно много ресурсов процессора

Question

У меня RHEL 6.10 с похожими проблемами. Единственное, что, похоже, помогает, — это завершение долго работающих пользовательских процессов sftp на клиенте NFS. Это были процессы, которые клиенты SFTP на основе GUI (например, WinSCP, Nimble Commander) держали открытыми в течение многих часов (> 10 часов).

Мониторинг показывает некоторую активность клиентов NFSv3, совпадающую с проблемой, но эта активность на самом деле ниже, чем типичная активность на других клиентах (их > 100), которые не вызывают проблему.

На самом деле, не так уж много операций ввода-вывода сделано.

ОБНОВЛЕНИЕ 2019-12-10: Основная причина, по-видимому, заключалась в квотах XFS на сервере NFS. Домашние каталоги пользователей имеют квоты, с мягким ограничением на 2 ГБ ниже жесткого ограничения. Некоторые пользователи пытались установить полную версию Anaconda Python, что превысило мягкое ограничение. Установщик Anaconda, похоже, не имел возможности перехватывать предупреждения и продолжал загружать файлы сверх мягкого ограничения. Это приводило к огромному количеству предупреждений о квотах, полностью затормаживая систему и делая ее неотзывчивой.

Я говорю "кажется", потому что доказательства косвенные. Когда пользователи попробовали установить в каталог без квоты, все прошло нормально.

Answer 1

У меня RHEL 6.10 с похожими проблемами. Единственное, что, похоже, помогает, — это завершение долго работающих пользовательских процессов sftp на клиенте NFS. Это были процессы, которые клиенты SFTP на основе GUI (например, WinSCP, Nimble Commander) держали открытыми в течение многих часов (> 10 часов).

Мониторинг показывает некоторую активность клиентов NFSv3, совпадающую с проблемой, но эта активность на самом деле ниже, чем типичная активность на других клиентах (их > 100), которые не вызывают проблему.

На самом деле, не так уж много операций ввода-вывода сделано.

ОБНОВЛЕНИЕ 2019-12-10: Основная причина, по-видимому, заключалась в квотах XFS на сервере NFS. Домашние каталоги пользователей имеют квоты, с мягким ограничением на 2 ГБ ниже жесткого ограничения. Некоторые пользователи пытались установить полную версию Anaconda Python, что превысило мягкое ограничение. Установщик Anaconda, похоже, не имел возможности перехватывать предупреждения и продолжал загружать файлы сверх мягкого ограничения. Это приводило к огромному количеству предупреждений о квотах, полностью затормаживая систему и делая ее неотзывчивой.

Я говорю "кажется", потому что доказательства косвенные. Когда пользователи попробовали установить в каталог без квоты, все прошло нормально.

NFS-сервер не отвечает клиентам, процессы «миграция» и «xfssyncd» потребляют необычно много ресурсов процессора

решение1

Связанный контент