目次:
定義-並列データ分析とはどういう意味ですか?
並列データ分析は、複数のコンピューターで同時に実行される並列プロセスを使用してデータを分析する方法です。
このプロセスは、1つのリレーショナルデータベースに入れるには大きすぎるテキストドキュメントの大きな電話レコード、ネットワークログ、Webリポジトリなどの大きなデータセットの分析に使用されます。 この方法は、ビッグデータ分析および一般的なデータ分析でよく使用されます。
Techopediaは並列データ分析を説明します
並列データ分析の背後にある主要な概念は並列処理であり、コンピューティングではプロセスの同時実行として定義されます。
これは、多くの場合、複数のプロセッサまたは複数のコンピューターを使用して実現され、分散コンピューティングでは一般的な方法です。 データの並列分析では、データ分析のさまざまな側面を実行するさまざまなコンピューターがこれらのプロセスを同時に実行してから、結果を1つの大きなレポートに統合します。
この並列処理の理由は主に分析を高速化するためですが、一部のデータセットが動的である、大きすぎる、または単純に扱いにくいため、単一のリレーショナルデータベースに効率的に配置できないためです。 その結果、これらのデータセットは、その種類のデータ用に最適化されたさまざまなデータベースとさまざまなマシンに格納されるため、線形解析は効率的なオプションではありません。
