目次:
定義-ジョブチェーンとはどういう意味ですか?
ジョブチェーンはMapReduceの用語で、同じMapReduceタスクで複数のステップを起動することを指します。 ジョブチェーンを使用すると、最初のジョブは1つのジョブに出力を送信し、そのジョブはチェーン内の次のジョブに出力を送信し、ジョブが完了するまで続きます。 MapReduceジョブを管理しやすくするためのパイプライン化の形式です。
Techopediaはジョブチェーンについて説明します
MapReduceのジョブチェーンとは、1つのMapReduceジョブで複数のタスクを実行することです。
たとえば、ジョブチェーンは次のもので構成されます。
Map1> Reduce1> Map2> Reduce2
ジョブチェーンの利点は、パイプラインのすべてのステップ間の中間データが不要になることです。 その意味で、ジョブチェーンは、Unixシェルの入出力リダイレクトに似ています。 チェーン内の1つのリンクからの出力は、チェーン内の次のジョブの入力に流れます。 MapReduceを使用すると、開発者は依存関係、またはaddDependingJob()メソッド呼び出しを使用してチェーン内の次のジョブを処理する前に完了する必要があるジョブを指定できます。
これにより、開発者は大量のデータを処理できるMapReduceプログラムを簡単に作成できます。
