
Я управляю почтовым сервером для примерно 30 человек. У меня не было никаких проблем с ним. Но на прошлой неделе несколько пользователей начали сообщать об ошибке в своем почтовом клиенте Outlook:
Проверяя почтовый журнал сервера примерно в то время, когда произошла ошибка, я смог найти только эти записи, которые появились примерно в одно и то же время. Я даже не уверен, связаны ли эти записи с ошибкой Outlook (кажется, это не имеет никакого отношения к smtp), но тот факт, что соединения закрываются примерно в одно и то же время, и долгое время "ожидания ввода" выглядит подозрительно:
81218 Jan 18 11:56:56 ip-172-30-0-131 dovecot: imap(t.olixxxx)<3739040></Z84+joPNhRsOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1175.376 secs, 2 B in + 10 B out, state=wait-input) in=182 out=172366 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count=0 body_bytes=0
81219 Jan 18 11:56:56 ip-172-30-0-131 dovecot: imap(s.damxxxx)<3739037><iQY3+joPottsOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1174.763 secs, 2 B in + 10 B out, state=wait-input) in=182 out=799331 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count=0 body_bytes=0
81220 Jan 18 11:56:59 ip-172-30-0-131 postfix/smtpd[3740240]: warning: hostname 179.hosted-by.198xd.com does not resolve to address 45.129.14.179: Name or service not known
81221 Jan 18 11:56:59 ip-172-30-0-131 postfix/smtpd[3740240]: connect from unknown[45.129.14.179]
81222 Jan 18 11:57:00 ip-172-30-0-131 dovecot: imap(j.pomexxxxx)<3739095><k7z3/zoPqLdsOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1078.221 secs, 2 B in + 10 B out, state=wait-input) in=165 out=801497 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count= 0 body_bytes=0
81223 Jan 18 11:57:00 ip-172-30-0-131 dovecot: imap(a.cerxxxxx)<3739042><JCXQ+joPu5JsOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1169.527 secs, 2 B in + 10 B out, state=wait-input) in=182 out=303618 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count=0 body_bytes=0
81224 Jan 18 11:57:00 ip-172-30-0-131 dovecot: imap(h.foxxxxx)<3739034><kpEo+joP9g5sOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1180.675 secs, 2 B in + 10 B out, state=wait-input) in=194 out=1927 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count=0 bo dy_bytes=0
81225 Jan 18 11:57:00 ip-172-30-0-131 dovecot: imap(dxxxxxx)<3739057><xljV/DoPPnZsOgYu>: Connection closed (IDLE running for 0.001 + waiting input for 1135.454 secs, 2 B in + 10 B out, state=wait-input) in=182 out=458253 deleted=0 expunged=0 trashed=0 hdr_count=0 hdr_bytes=0 body_count=0 bod y_bytes=0
Ошибки не происходят постоянно у пользователей, но достаточно часто, чтобы раздражать. Я использую dovecot и postfix на Debian bullseye.
решение1
Dovecote — ваш сервер IMAP. Он позволяет почтовым клиентам получать письма, отправленные в почтовый ящик. Отправка писем (SMTP) обрабатывается Postfix в вашей настройке. Ошибка, которую вы нам показали, относится к SMTP. Тема вашего сообщения неверна.
Если оба сервера работают на одном хосте, и вытолькосм. ошибки SMTP, это указывает на проблему с SMTP-сервером, а не на проблему с хостом или сетью (но это далеко не окончательный вывод).
Вы проверили все журналы или только почтовый журнал?
Кстати, эти записи журнала сами по себе не являются ошибками и не имеют прямого отношения к тому, что вы нам показали на рисунке.
Даже для такой небольшой установки, как эта, наличие некоторого мониторинга, вероятно, целесообразно. Я бы также предложил проверить, сообщает ли Outlook об ошибке, если он теряет (установленное) подключение к серверу IMAP.
решение2
Первопричиной проблемы был пользователь, который ввел неправильный пароль на своем мобильном устройстве. Находясь в сети Wi-Fi клиента, устройство неоднократно пыталось войти в систему. Когда количество неудачных попыток входа достигло порогового значения, программное обеспечение fail2ban забанило IP-адрес на сервере на 10 минут. Это повлияло на возможность входа всех остальных.
После того, как меня забанили, в журнале почты не было никакой активности, а логи, которые я здесь выкладывал, были моей охотой за призраками.
Однако мне повезло заметить запись в журнале, которая показывала пользователя с сообщением «auth failed». Вот тут-то и загорелась лампочка: «пользователь может быть забанен fail2ban». Единственной загадкой было то, почему были забанены другие пользователи. Это стало очевидным вскоре после того, как я увидел, что один из IP-адресов пользователя с плохим паролем был на IP-адресе T-mobile.
решение3
На основании предоставленной вами информации, похоже, что проблема, с которой вы столкнулись, связана с Dovecot. Запись журнала, которой вы поделились, указывает на то, что соединение было закрыто после ожидания ввода в течение 1175,376 секунд. Это может быть вызвано различными причинами, такими как проблемы с сетевым подключением, неправильные настройки конфигурации или чрезмерное использование ресурсов. Для устранения этой проблемы я рекомендую выполнить следующие действия:https://www.linode.com/docs/guides/troubleshooting-problems-with-postfix-dovecot-and-mysql/