目次:
定義-データ検証とはどういう意味ですか?
データ検証は、データ移行後にデータの正確性を確認するプロセスです。 検証にはさまざまなタイプがあります。
- すべてのデータがチェックされる完全な検証
- データの小さなサンプルがチェックされるサンプリング検証
データ検証は、実行するのに費用と時間がかかります。
Techopediaはデータ検証について説明します
ビッグデータ処理システムで使用するためにデータウェアハウスからデータを移行する場合、データが正確であることを確認するためにデータをチェックする必要があります。 スペルミスから不正確な数値、データ損失まで、すべてがビッグデータプロジェクトを危険にさらす可能性があります。
データを検証する1つの方法は、1つのシステムのデータと他のシステムの移行データを1対1で比較することですが、これには時間がかかり、2つのシステムを実行するコストが高くなります。
データのサブセットのみをチェックすることもできますが、サンプルがすべてのデータを表すことはできません。 管理者は、正確性を確保しながらデータ検証の時間と費用を抑えることのトレードオフを検討する必要があります。 プロセスの自動化は1つのソリューションです。
