Hadoop 클러스터의 여러 JobTracker 노드가 의미하는 바는 무엇입니까?

Question

다중 JobTracker는 다중 클러스터 아키텍처에서 유용할 수 있습니다. 따라서 클러스터 수준 로드는 JobTracker 간에 분산될 수 있습니다.

단일 클러스터에서는 다음이 문제가 될 수 있습니다.

(a) 여러 JobTracker 서버가 HDFS 클러스터를 공유하는 경우 각각은 서로 다른 mapred.system.dir을 가져야 합니다. 그렇지 않으면 JobTracker가 서로의 작업 파일을 삭제합니다.

(b) 관리 스크립트 "모두 시작 또는 모두 중지"는 각각 다른 포트를 얻지 않는 한 문제가 됩니다.

Answer 1

다중 JobTracker는 다중 클러스터 아키텍처에서 유용할 수 있습니다. 따라서 클러스터 수준 로드는 JobTracker 간에 분산될 수 있습니다.

단일 클러스터에서는 다음이 문제가 될 수 있습니다.

(a) 여러 JobTracker 서버가 HDFS 클러스터를 공유하는 경우 각각은 서로 다른 mapred.system.dir을 가져야 합니다. 그렇지 않으면 JobTracker가 서로의 작업 파일을 삭제합니다.

(b) 관리 스크립트 "모두 시작 또는 모두 중지"는 각각 다른 포트를 얻지 않는 한 문제가 됩니다.

관련 정보