如何在 Solaris SunOS 5.10 中存取竊取時間數據

Question

您真正的問題似乎是性能下降。在 Solaris 10 T1000/T2000 伺服器上，竊取時間可能毫無意義。

若要找出您是否在區域中運行，請使用該/usr/bin/zonename命令（不同版本的 Solaris 上的位置可能不同 - 還要檢查/bin、/sbin/和/usr/sbin。）如果zonename返回除之外的任何內容global，則表示您正在區域中運行。

如果您由於某些原因無法存取該zonename命令，您可以使用多個ps命令來查看您是否位於區域中。首先，尋找init：

ps -ef | grep init

如果沒有找到initPID 為的進程1，則表示您處於區域。您也可以查找zsched（IIRC）：

ps -ef | grep zsched

如果返回一個進程，該進程是它自己的父進程（PID 和 PPID 相同且大於1），那麼您正在一個區域中運行。

如果您在某個區域中，您可能會遇到資源限制，從而減慢速度。但情況可能並非如此。

什麼別的正在伺服器上運行，但是？包括其他區域。我在 Sun T 系列伺服器上看到非常嚴重的效能問題，與您所描述的類似，這是由 ZFS ARC 和使用大內存頁的應用程式（例如 Oracle 資料庫）之間的交互引起的。

ZFS ARC 使用 4k 記憶體頁，因此它會產生記憶體碎片 - 並且會產生碎片全部伺服器上的記憶體。如果您的伺服器進入該狀態並且進程需要大量大記憶體頁面，則核心必須將一堆小頁面合併為大頁面，這涉及移動大量記憶體。而且這一切都是單線程完成的。早期 T 系列伺服器上的任何單線程都是慢的因為伺服器被設計為處理大量具有大延遲的執行緒 - 例如處理網路上的大量連接的 Web 伺服器或資料庫伺服器。

因此，核心會進入很長一段時間，它所做的幾乎所有事情都是將小記憶體頁面合併成大頁面。

然後，ZFS ARC 在大頁面使用過程完成後取回這些頁面，並且它們會變得碎片化。

我懷疑您可能遇到了完全相同的問題。

要找出答案，請運行

echo ::memstat | mdb -k

如果您正在執行區域，則以 root 身分在全域區域中。如果您的可用記憶體非常低，則可能會遇到此問題。

要找到答案，請再次以全域區域的 root 身分執行以下 dTrace 腳本，以確定核心所有時間都花在哪裡：

#!/usr/sbin/dtrace -s

profile:::profile-1001hz
/arg0/
{
    @[ stack() ] = count();
}

將其複製到一個文件，例如hot.d，將其設置為可執行文件 ( chmod 755 hot.d) 並從全域區域以 root 身份運行它：

./hot.d

當您遇到速度緩慢時運行它。讓它在發出後運行 10-20 秒（如果不是更長）matched 1 probe，然後用來中斷它CTRL-C。然後它會發出一個很多輸出，其中大部分是您不關心的。然而，最後少數堆疊追蹤輸出將是最常見的取樣，這將告訴您核心在哪裡花費了所有時間。

這將明確告訴您問題出在哪裡。它可能不夠精確，無法完全解決問題，您可能需要做更多調查，但您會知道該去哪裡尋找。

如果您在其中看到大量堆疊跟踪，idle則wait表示存在用戶空間問題。您可以透過將stack()上面的 dTrace 腳本替換為來ustack()獲取使用者堆疊來識別這一點。

如果您在函數名稱中看到大量堆疊跟踪coalesce，則核心正在花費所有時間創建大記憶體頁面。解決這個問題的方法是釋放內存，最有可能的是透過限制 ZFS ARC 大小，甚至可能嚴格限制。我不得不髕骨一些伺服器上的 ZFS ARC，降至 1 GB 以下，以防止其影響效能。

Answer 1