目次:
定義-データ品質とはどういう意味ですか?
データ品質は、さまざまな観点からデータプロパティを測定する複雑な方法です。 これは、アプリケーションの効率、信頼性、データ、特にデータウェアハウスに存在するデータの適合性に関する包括的な調査です。
組織内では、適切なデータ品質がトランザクションおよび運用プロセス、ならびにビジネスインテリジェンス(BI)およびビジネス分析(BA)レポートの寿命にとって不可欠です。 データの品質は、データの入力、処理、および保守の方法によって影響を受ける場合があります。
データ品質保証(DQA)は、データの効率と信頼性を検証することを目的とした手順です。
Techopediaがデータ品質を説明
効果的なデータ品質の維持には、定期的なデータの監視とクリーニングが必要です。 一般に、データ品質の維持には、データの更新/標準化とレコードの重複排除による単一のデータビューの作成が含まれます。
主要なデータ品質コンポーネントは次のとおりです。
- 完全性:必要なデータ属性が提供されるレベル。 データは完全に完全である必要はありません。
- 精度:データの実際の状態を表します。 さまざまなリストとマッピングを使用して自動化された方法を使用して計算できます。
- 信頼性:データが信頼でき、真であると見なされる範囲。 ソースによって異なる場合があります。
- 適時性(データの年齢):現在のベンチャーのためにデータが適切に更新される程度。
- 一貫性:さまざまなデータセットのファクトが一致するかどうかを評価します。
- 整合性:参照の有効性とさまざまなデータセットの正確な結合を評価します。
データ品質は次の理由で重要です。
- 説明責任とサービスを処理するための正確でタイミングの良い情報を提供します。
- サービスの有効性を処理するための迅速な情報を提供します。
- 効果的なリソース利用の優先順位付けと保証に役立ちます。