ジョブトラッカーとは何ですか？ -techopediaからの定義

2026

定義-JobTrackerの意味？

JobTrackerは、Apache HadoopのMapReduceエンジンで実行されるデーモンです。 JobTrackerは、すべてのMapReduceタスクをクラスター内の異なるノード、理想的には既にデータを含むノード、または少なくともデータを含むノードと同じラックに配置されているノードにファームアウトする重要なサービスです。

TechopediaはJobTrackerについて説明します

JobTrackerは、クライアントのリクエストを処理するHadoop内のサービスです。必要なデータがローカルに存在するDataNodeのTaskTrackersにそれらを割り当てます。それが不可能な場合、JobTrackerは、データがローカルに存在する同じラック内のTaskTrackerにタスクを割り当てようとします。何らかの理由でこれも失敗した場合、JobTrackerはデータのレプリカが存在するTaskTrackerにタスクを割り当てます。 Hadoopでは、冗長性を確保するためにデータブロックがデータノード間で複製されるため、クラスター内の1つのノードに障害が発生しても、ジョブは失敗しません。

JobTrackerプロセス：

クライアントアプリケーションからのジョブリクエストはJobTrackerによって受信され、
JobTrackerは、必要なデータの場所を決定するためにNameNodeを調べます。
JobTrackerは、データを含む、または少なくともデータの近くにあるTaskTrackerノードを見つけます。
選択したTaskTrackerにジョブが送信されます。
TaskTrackerは、JobTrackerによって厳密に監視されながらタスクを実行します。ジョブが失敗した場合、JobTrackerは単にジョブを別のTaskTrackerに再送信します。ただし、JobTracker自体は単一障害点です。つまり、障害が発生するとシステム全体がダウンします。
JobTrackerは、ジョブが完了するとステータスを更新します。
クライアントリクエスターは、JobTrackerから情報をポーリングできるようになりました。