Как отфильтровать наиболее распространенные проблемы с tcpdump/tshark

Как отфильтровать наиболее распространенные проблемы с tcpdump/tshark

В настоящее время я использую следующую команду в Linux для получения подробной информации о проблемах с сетью.

tshark -r file.pcap -q -z io,stat,1,\

"COUNT(tcp.analysis.retransmission) tcp.analysis.retransmission",\

"COUNT(tcp.analysis.duplicate_ack)tcp.analysis.duplicate_ack",\

"COUNT(tcp.analysis.lost_segment) tcp.analysis.lost_segment",\

"COUNT(tcp.analysis.fast_retransmission) tcp.analysis.fast_retransmission"

Это выводит хорошую таблицу с большим количеством полезной информации. Однако я хотел бы знать, какие еще столбцы я мог бы добавить, чтобы получить больше информации, например, неверные контрольные суммы, и что-то, что могло бы указать на перегрузку сети. Практически все, что нужно для указания на проблемы с производительностью.

решение1

С перегрузкой сети обычно хорошо справляется сам TCP, используя либомедленный старт, избежание заторов, илибыстрая повторная передача / быстрое восстановлениеалгоритмы, описанные вRFC2581. TCP попытается исправить ситуацию до того, как возникнет значительная перегрузка.

Теперь, если вы работаете в каком-то особом случае, вы можете добавить измерение RTT и его дисперсию, отслеживать размер окна отправителя (cwnd) и отслеживать появление флагов CWR и ECE.

PS: Обработка контрольной суммы обычно выгружается драйвером сетевой карты, поэтому это не будет хорошей метрикой для мониторинга, поскольку в инструментах на основе libpcap она будет отображаться некорректно.

Связанный контент