Auswirkungen mehrerer JobTracker-Knoten in einem Hadoop-Cluster?

Question

Mehrere JobTracker können in einer Multi-Cluster-Architektur nützlich sein. So kann die Last auf Clusterebene auf die JobTracker verteilt werden.

In einem einzelnen Cluster kann die Nachverfolgung zu einem Problem werden.

(a) Wenn mehrere JobTracker-Server einen HDFS-Cluster gemeinsam nutzen, muss jeder über ein anderes mapred.system.dir verfügen, andernfalls löschen die JobTracker gegenseitig ihre Jobdateien.

(b) Das Admin-Skript „Start-all oder stop-all“ wird zum Problem, sofern nicht jedes einen anderen Port erhält.

Answer 1

Mehrere JobTracker können in einer Multi-Cluster-Architektur nützlich sein. So kann die Last auf Clusterebene auf die JobTracker verteilt werden.

In einem einzelnen Cluster kann die Nachverfolgung zu einem Problem werden.

(a) Wenn mehrere JobTracker-Server einen HDFS-Cluster gemeinsam nutzen, muss jeder über ein anderes mapred.system.dir verfügen, andernfalls löschen die JobTracker gegenseitig ihre Jobdateien.

(b) Das Admin-Skript „Start-all oder stop-all“ wird zum Problem, sofern nicht jedes einen anderen Port erhält.

Auswirkungen mehrerer JobTracker-Knoten in einem Hadoop-Cluster?

Antwort1

verwandte Informationen