頁面掛在等待查詢上，消耗記憶體並需要 2 小時才會失敗

Question 1

1）發布堆疊追蹤。

我保證它們將掛在 Socket.read() （或類似的）上

發生的情況是 1/2 到 db 的 tcp 連線關閉，讓 cf 等待它永遠不會得到的回應。

cf 盒和資料庫之間有網路問題。

Java 資料庫驅動程式通常不擅長處理這個問題

感謝您的堆疊追蹤

這證實了我的假設，即 1/2 tcp 連線關閉。

我懷疑以下情況之一：1）mysql在linux上，並且TCP堆疊中存在錯誤，因此您需要升級該機器上的linux - 是的，我以前見過這個2）coldfusion在linux上..按照1 ) 3) 兩個盒子上或之間的電纜/硬體故障4) 如果您運行的是Windows，請停用TCP 卸載！

第3）是最難的。您需要在兩個盒子上運行wireshark並證明資料包遺失。更簡單的解決方案是將 Rackspace 虛擬機器移至不同的實體主機並查看它是否消失。（極有可能你的程式碼非常非常糟糕，而且你正在使 CF 盒和 MySQL 盒之間的網路飽和，但我不確定是否有可能編寫那麼糟糕的程式碼）

Answer

1）發布堆疊追蹤。

我保證它們將掛在 Socket.read() （或類似的）上

發生的情況是 1/2 到 db 的 tcp 連線關閉，讓 cf 等待它永遠不會得到的回應。

cf 盒和資料庫之間有網路問題。

Java 資料庫驅動程式通常不擅長處理這個問題

感謝您的堆疊追蹤

這證實了我的假設，即 1/2 tcp 連線關閉。

我懷疑以下情況之一：1）mysql在linux上，並且TCP堆疊中存在錯誤，因此您需要升級該機器上的linux - 是的，我以前見過這個2）coldfusion在linux上..按照1 ) 3) 兩個盒子上或之間的電纜/硬體故障4) 如果您運行的是Windows，請停用TCP 卸載！

第3）是最難的。您需要在兩個盒子上運行wireshark並證明資料包遺失。更簡單的解決方案是將 Rackspace 虛擬機器移至不同的實體主機並查看它是否消失。（極有可能你的程式碼非常非常糟糕，而且你正在使 CF 盒和 MySQL 盒之間的網路飽和，但我不確定是否有可能編寫那麼糟糕的程式碼）

Question 2

我花了更多時間研究這個問題，並添加了一些有關網路問題的具體原因的更多詳細信息，以及在 Charlie Arehart 的幫助下找到的解決方法。

首先，網路連線會被自動腳本觸發中斷iptables restart。這會更新可以存取伺服器的 IP 位址列表，但也會中斷應用程式和資料庫伺服器之間的任何連線。

它更有可能發生在速度較慢的頁面或運行頻率較高的頁面上，但與iptables restart程式碼一致的任何內容都會被切斷。

Rackspace 為我找到了這個並建議更改程式碼：

/sbin/service iptables restart

到

/sbin/iptables-restore < /etc/sysconfig/iptables

這會停止重新啟動服務並僅適用於新連線。

這是問題的根本原因，但真正的問題是 Coldfusion，或者實際上是底層的 JDBC，不會停止等待資料庫伺服器的回應。

我不確定 2 小時超時是從哪裡來的（假設它是預設值），但 Charlie 展示了一種在 CFIDE 連接字串中設定較低逾時的方法 - 這告訴 CF 在放棄 DB 之前等待最長時間。

所以我們的連接字串是：

__fusionreactor_name=datasourcename;connectTimeout=600000;socketTimeout=600000;

我不記得這兩個的具體細節，但他們設定了一個以毫秒為單位的等待時間，然後放棄資料庫連線：

連線逾時=600000；
套接字超時=600000；

這只是在 Fusion Reactor 中標記資料來源 - 如果您有它，它對於查找 CF 應用程式中的問題非常有用。如果你沒有聚變反應堆，那麼請忽略這一點。

__fusionreactor_name=dsnapi;

您必須將其應用於 CFIDE 中的每個資料來源

Answer