目次:
定義-データ抽出とはどういう意味ですか?
データ抽出とは、データを分析してクロールし、特定のパターンでデータソース(データベースなど)から関連情報を取得する場所です。 さらにデータ処理が行われます。これには、メタデータの追加やその他のデータ統合が含まれます。 データワークフローの別のプロセス。
データ抽出の大部分は、非構造化データソースとさまざまなデータ形式から行われます。 この非構造化データは、テーブル、インデックス、分析など、どのような形式でもかまいません。
Techopediaはデータ抽出について説明します
ウェアハウス内のデータはさまざまなソースからのものである可能性があり、データウェアハウスでは着信データを利用するために3つの異なる方法が必要です。 これらのプロセスは、抽出、変換、および読み込み(ETL)と呼ばれます。
データ抽出のプロセスには、乱れたデータソースからのデータの取得が含まれます。 データ抽出は、リレーショナルデータベースのステージング領域にロードされます。 ここでは、抽出ロジックが使用され、アプリケーションプログラミングインターフェイスを使用してソースシステムにデータが照会されます。 このプロセスに続いて、データはETLプロセスの変換フェーズを通過する準備ができました。
