netdata ipv4 UDP エラー

Question

netdataメトリック収集システムとして使用しますstatsd。これは、非常に高速で効率的な UDP ベースのプロトコルですが、レートが高いと、イングレスノードの recv_buffer がオーバーフローする可能性があります。デフォルトの受信バッファは約 1M です。そのため、statsd エージェントがバッファがいっぱいにならないように十分な速さで消費できない場合、カーネルはデータグラムをドロップします。

簡単な解決策は、スパイクを処理するために受信バッファを大きくすることです。これにより、通常、UDP バッファオーバーランの問題が解決されます。それでも上記のログが常に表示される場合は、マシンの CPU 容量を増やすか、よりパフォーマンスの高い statsd 実装に移行する必要があります (標準の nodejs ベースの statsd クライアントから C++ ベースのクライアントに移行する必要がありました)。

バッファサイズを増やすには、次のコマンドを使用します。

# echo "net.core.rmem_default=8388608" >> /etc/sysctl.conf
# echo "net.core.rmem_max=16777216" >> /etc/sysctl.conf
# sysctl -p

上記のパラメータは非常に強力で、カーネルスタックのメモリ使用量が増加します。最初は小さい値から始めて、そこから増やしていくとよいでしょう。従来の比率はですmax = default * 2。

詳細は以下をご覧ください:https://www.ibm.com/support/knowledgecenter/en/SSQPD3_2.6.0/com.ibm.wllm.doc/UDPSocketBuffers.html

Answer 1