Возможная DOS-атака или "сбой" компьютера

Question

Конечно, это возможно, хотя это зависит от ряда факторов:

1) Похоже, что у приложения на стороне сервера проблемы с параллелизмом. Возможно, стоит проверить, были ли узким местом серверы приложений или же это было вышестоящее звено, например, БД, и серверам приложений не хватило памяти из-за того, что конфигурация Apache недостаточно быстро сбрасывала потоки. Если это были серверы приложений, возможно, стоит провести некоторую настройку — развернуть идентичную машину за пределами ELB и использовать JMeter, чтобы нагрузить ее и выявить узкие места.

Если бы это была база данных, вы могли бы использовать memcache/elasticache (так как это выглядит так, как будто вы извлекаете определенный объект) для кэширования реальных запросов. Таким образом, соединения с базой данных реагируют быстро, Apache может быстро реагировать и убивать потоки, а не заполнять пул памяти машины приложения.

Если вы действительно чувствуете себя уязвимым, вы можете разместить Varnish в верхнем потоке для кэширования запросов с TTL 1-5 с, чтобы предотвратить большой поток запросов. Но будьте осторожны, так как VCL не прощает ошибок и может привести к серьезным проблемам и боли (отравление/утечка кэша).

2) Что касается самой "субъектной" машины. Очевидно, что она могла быть скомпрометирована - это определенно должно быть исследовано. Я позволю вам решить, честен ли IT-шник или нет - это выходит за рамки serverfault.

Если предположить, что он не был скомпрометирован, это мог быть какой-то плохой код javascript - если вы делаете обновления опроса и каким-то образом был изменен параметр синхронизации, он вполне мог начать отправлять много запросов в секунду. Аналогично, JS мог вести себя хорошо, но человек мог открыть 25 вкладок и уйти домой на вечер - если каждая отправляет 1 запрос в 5 секунд, это 5req/сек.

Answer 1