目次:
定義-データマイニングとはどういう意味ですか?
データマイニングは、データウェアハウスなどの共通領域で収集および組み立てられ、効率的な分析、データマイニングアルゴリズム、ビジネスの意思決定およびその他の情報を促進する有用な情報に分類するためのさまざまな観点に従ってデータの隠されたパターンを分析するプロセスです最終的にコストを削減し、収益を増やすための要件。
データマイニングは、データ検出および知識検出とも呼ばれます。
Techopediaはデータマイニングについて説明します
データマイニングプロセスに含まれる主な手順は次のとおりです。
- データの抽出、変換、およびデータウェアハウスへのロード
- データを多次元データベースに保存および管理する
- アプリケーションソフトウェアを使用してビジネスアナリストにデータアクセスを提供する
- 分析したデータをグラフなどのわかりやすい形式で提示する
データマイニングの最初のステップは、ビジネスに不可欠な関連データを収集することです。 会社データは、トランザクション、非運用、またはメタデータのいずれかです。 トランザクションデータは、販売、在庫、コストなどの日常業務を処理します。通常、非運用データは予測されますが、メタデータは論理データベースの設計に関係します。 データ要素間のパターンと関係により関連情報が表示され、組織の収益が増加する可能性があります。 消費者を重視する組織は、データマイニング手法を使用して、販売された製品、価格、競合、顧客の人口統計の明確な写真を提供します。
たとえば、小売大手のWal-Martは、関連するすべての情報をテラバイトのデータとともにデータウェアハウスに送信します。 サプライヤはこのデータに簡単にアクセスできるため、顧客の購入パターンを識別できます。 データマイニング技術を利用して、買い物習慣、ほとんどの買い物日、製品やその他のデータを求めているパターンを生成できます。
データマイニングの2番目のステップは、適切なアルゴリズム(データマイニングモデルを生成するメカニズム)を選択することです。 アルゴリズムの一般的な動作には、一連のデータの傾向を特定し、出力をパラメーター定義に使用することが含まれます。 データマイニングに使用される最も一般的なアルゴリズムは、分類アルゴリズムと回帰アルゴリズムで、データ要素間の関係を識別するために使用されます。 OracleやSQLなどの主要なデータベースベンダーは、データマイニングの需要を満たすために、クラスタリングや回帰分析などのデータマイニングアルゴリズムを組み込んでいます。
