我的 AWS ERP 伺服器現在已經崩潰了 4 次,原因是記憶體顯然已達到極限,系統基本上因 100% CPU 且沒有[很少]可用 RAM 而崩潰。
Ubuntu 18.04.5 LTS (GNU/Linux 5.4.0-1060-aws x86_64) (AWS AMI)
在 GitHub 操作過程中,這種情況發生了 3 次。該操作是執行資料庫導入,然後是鬆弛通知。因此,您可能會認為是這些步驟之一導致了問題,但奇怪的是,這些步驟都正常完成。資料庫沒問題,推播了鬆弛通知。
GitHub 本身與跑步者失去了連接,即使在操作完成後,虛擬記憶體也急劇上升。
第四次發生這種情況時,什麼都沒有運行。事實上,伺服器處於空閒狀態,沒有發生任何事情。然而,我沒有任何日誌或“頂部”屏幕截圖,但我確實有一次在現場發現了它:
所以該系統是具有 4G RAM 的 AWS 虛擬機器。請注意,我相信設定此系統的 SI 配置為沒有交換空間。對於伺服器來說,這可以說是正確的(非常有爭議),從某種意義上說,如果存在記憶體洩漏,您希望系統報告記憶體不足並採取糾正措施,就像記憶體洩漏一樣,您最終會死掉。
在短期內,我被要求將記憶體增加一倍。這有點不必要,因為它是一個負載非常輕的系統(通常在執行繁重的批次作業時僅使用大約2G 的RAM 運行),坦白說,如果GitHub Runner.Worker 在4GB 系統上最大使用7GB RAM ,為什麼8GB 虛擬機器上的 RAM 不會達到最大 16GB,但我們會看看它是否會再次崩潰。我並不反對更改 TFG 的交換配置,但我不確定這是否是解決方案
我已將此事報告給 GitHub,但經過超過 3 週的無所作為,我想在這裡查看一下,看看是否有人有任何想法或修復。
謝謝你,
==約翰==