開発 データスクラブとは何ですか? -techopediaからの定義

データスクラブとは何ですか? -techopediaからの定義

目次:

Anonim

定義-データスクラビングとはどういう意味ですか?

データスクラビングとは、データベース内の不完全なデータ、不正確なデータ、不正確にフォーマットされたデータ、または繰り返されるデータを変更または削除する手順を指します。 データスクラビングの主な目的は、データをより正確で一貫したものにすることです。

データスクラビングは、データベースの正確性を維持するための重要な戦略です。 通信、保険、銀行、小売など、データ集約型の業界では特に重要です。 データスクラビングは、ルックアップテーブル、ルール、およびアルゴリズムを使用して、データの欠陥やミスを体系的に評価します。

データスクラビングは、データクレンジングとも呼ばれます。

Techopediaはデータスクラビングについて説明します

データベースエラーは一般的であり、次の原因が考えられます。

  • データ入力中の人為的エラー
  • データベースのマージ
  • 業界全体または企業固有のデータ標準がない
  • 古くなったデータを含む古いシステム

過去には、データのスクラビングは手動で実行されていました。 これにより、プロセスを完了するのに必要な時間が長くなるだけでなく、プロセスがより高価になり、エラーが発生しやすくなりました。 これにより、効果的なデータスクラブツールが作成され、手動のクリーニングプロセスでは特定できなかった欠陥のデータを体系的に評価しました。


一般に、データベーススクラビングツールは、重複レコードの特定や欠落している郵便番号の置換など、特定の種類の間違いを修正するのに理想的なソリューションで構成されています。 誤ったデータまたは破損したデータのマージは、最も複雑な問題です。 組織には毎年数百万ドルのコストがかかるため、「ダーティデータ」問題とさえ言われています。 この現象は、より多くのシステムとデータを備えたより複雑なビジネス環境の導入とともに増加しています。 データスクラビングは、データの欠陥を特定して根絶するための強力なデータスクラビングツールを提供することにより、組織がこのような問題に取り組むのに役立ちます。

データスクラブとは何ですか? -techopediaからの定義