目次:
定義-抽出とはどういう意味ですか?
抽出は、データウェアハウジング環境で使用する特定のパターンでデータソースから関連情報を取得するプロセスです。 抽出はデータに意味を追加し、データ変換プロセスの最初のステップです。 抽出では、さまざまなソースからの膨大なデータのコレクションから、条件またはカテゴリに適合する特定のデータのみが選択されます。
Techopediaは抽出について説明します
データウェアハウジング環境では、さまざまな構造と非構造化ソースからの膨大なデータのコレクションを処理、変換、保存して、有意義な結論と予測を導き出す必要があります。 一次ソースからのデータは、体系的な方法でデータウェアハウジングシステムにインポートする必要があります。これにより、データに対するさまざまな操作を簡単に実行できます。 このプロセスは抽出と呼ばれます。 抽出は、特定のルールに従うことにより、そうでなければ非構造化データに構造を追加します。 以下は、データ抽出で使用される手法の一部です。
- パターンマッチング
- テーブルベースのアプローチ
- テキスト分析
