我正在嘗試找到一個工具,它可以向我展示我的 Hadoop 生態系統的概述 - 狀態、運行狀況、正在運行的任務等。有什麼好用的工具嗎?
答案1
正在運行的任務,mapred節點狀態/健康狀況:
http://example.com:50030/jobtracker.jsp
HDFS 健康狀況與節點狀態:
http://example.com:50070/dfshealth.jsp
將 example.com 替換為作業追蹤器/名稱節點的 IP 或主機名稱。
如果這些連接埠不正確,請檢查您的 mapred-site.xml 和 hdfs-site.xml 中定義的連接埠。
答案2
Cloudera 提供了一個專有工具,可以執行您所描述的操作,更稱為Cloudera管理器。它不是 F/OSS,但它們確實有一個免費版本,可以讓您在有限數量的節點上運行。它是一個完整生命週期的產品,因此對於您的需求來說可能有點過分了。
完全披露:我自己從未使用過它。我們在我的公司考慮過它,但最終沒有使用它。