データベース データベースの知識発見とは何ですか(kdd)? -techopediaからの定義

データベースの知識発見とは何ですか(kdd)? -techopediaからの定義

目次:

Anonim

定義-データベースでの知識発見(KDD)とはどういう意味ですか?

データベースでの知識発見(KDD)は、データのコレクションから有用な知識を発見するプロセスです。 この広く使用されているデータマイニング手法は、データの準備と選択、データのクレンジング、データセットに関する事前知識の組み込み、および観測結果からの正確な解の解釈を含むプロセスです。

主要なKDDアプリケーション領域には、マーケティング、不正検出、通信、製造が含まれます。

Techopediaはデータベース(KDD)での知識発見について説明します

従来、データマイニングと知識発見は手動で実行されていました。 時間の経過とともに、多くのシステムのデータ量はテラバイトサイズを超えて増加し、手動で維持できなくなりました。 さらに、ビジネスを成功させるためには、データの基本的なパターンを発見することが不可欠であると考えられています。 その結果、隠されたデータを発見して推測を行うためのいくつかのソフトウェアツールが開発され、人工知能の一部を形成しました。

KDDプロセスは過去10年間でピークに達しました。 現在、誘導学習、ベイジアン統計、セマンティッククエリ最適化、エキスパートシステムの知識獲得、情報理論など、発見に対するさまざまなアプローチが含まれています。 最終的な目標は、低レベルのデータから高レベルの知識を抽出することです。

KDDには学際的な活動が含まれます。 これには、データの保存とアクセス、大量のデータセットへのアルゴリズムのスケーリング、結果の解釈が含まれます。 データウェアハウジングに含まれるデータクレンジングとデータアクセスプロセスは、KDDプロセスを促進します。 人工知能は、実験と観測から経験則を発見することによりKDDもサポートします。 データで認識されるパターンは、新しいデータで有効であり、ある程度の確実性を備えている必要があります。 これらのパターンは新しい知識と見なされます。 KDDプロセス全体に含まれるステップは次のとおりです。

  1. 顧客の観点からKDDプロセスの目標を特定します。
  2. 関連するアプリケーションドメインと必要な知識を理解する
  3. ディスカバリーを実行するターゲットデータセットまたはデータサンプルのサブセットを選択します。
  4. 欠落しているフィールドを処理し、要件に従ってデータを変更する戦略を決定することにより、データをクレンジングおよび前処理します。
  5. 不要な変数を削除して、データセットを簡素化します。 次に、目標またはタスクに応じて、データを表すために使用できる有用な機能を分析します。
  6. KDDの目標をデータマイニング手法と一致させて、隠れたパターンを提案します。
  7. データマイニングアルゴリズムを選択して、隠れたパターンを発見します。 このプロセスには、KDDプロセス全体に適切なモデルとパラメーターの決定が含まれます。
  8. 分類ルールまたはツリー、回帰およびクラスタリングを含む、特定の表現形式で関心のあるパターンを検索します。
  9. 採掘されたパターンから重要な知識を解釈します。
  10. 知識を使用して、さらなるアクションのために別のシステムに組み込みます。
  11. それを文書化し、利害関係者に報告します。
データベースの知識発見とは何ですか(kdd)? -techopediaからの定義