目次:
定義-K-Meansクラスタリングとはどういう意味ですか?
K平均クラスタリングは、クラスタリングの問題を解決するために使用される単純な教師なし学習アルゴリズムです。 所定のデータセットを、事前に固定されている文字「k」で定義されたいくつかのクラスターに分類する簡単な手順に従います。 次に、クラスターをポイントとして配置し、すべての観測値またはデータポイントを最も近いクラスターに関連付け、計算、調整し、目的の結果に達するまで新しい調整を使用してプロセスをやり直します。
K-meansクラスタリングは、検索エンジン、マーケットセグメンテーション、統計、さらには天文学でも使用できます。
TechopediaはK-Meansクラスタリングを説明します
K-meansクラスタリングは、特にデータマイニングと統計のクラスタリング分析に使用される方法です。 一連の観測値をいくつかのクラスター(k)に分割し、データをボロノイセルに分割することを目的としています。 特定のオブジェクトが実際に属しているグループを見つける方法と考えることができます。
主に統計で使用され、ほぼすべての研究分野に適用できます。 たとえば、マーケティングでは、さまざまな人々の人口統計を単純なグループにグループ化して、マーケティング担当者がターゲットに設定しやすくするために使用できます。 天文学者はこれを使用して、大量の天文学データを選別します。 各オブジェクトを1つずつ分析することはできないため、観察と調査のために関心のあるポイントを統計的に見つける方法が必要です。
アルゴリズム:
- K点は、重心の初期グループを表すオブジェクトデータ空間に配置されます。
- 各オブジェクトまたはデータポイントは、最も近いkに割り当てられます。
- すべてのオブジェクトが割り当てられた後、k個の重心の位置が再計算されます。
- 重心の位置が移動しなくなるまで、手順2と3を繰り返します。