Q:
均衡の概念は機械学習プロジェクトにどのように情報を与えることができますか?
A:一般に、均衡は、機械学習環境を安定化させ、決定論的コンポーネントと確率論的コンポーネントの互換性のある組み合わせで結果を作成しようとすることにより、機械学習に通知します。
専門家は、「平衡」を、機械学習システムの合理的なアクターが戦略的行動に関するコンセンサスに達する状況として説明します。特に、ゲーム理論におけるナッシュ均衡は、他のプレイヤーが変更しない場合、特定の戦略を変更します。
無料ダウンロード: 機械学習とその重要性 |
ナッシュ均衡の特に人気のある単純なデモンストレーションには、2人のプレイヤーがそれぞれバイナリの結果を選択する単純なマトリックスが含まれます。
上記は、平衡とそれがどのように機能するかを説明するかなり技術的な方法です。 平衡の概念を説明するためのはるかに非公式な方法、特にそれぞれが二項選択を持つ2人の合理的な俳優の上記の例は、「高校の廊下でお互いに向かって歩く」シナリオと呼ばれるものについて考えることです。
幅が2人分のスペースしかない高校の廊下(またはその他の種類のエリア)を2人が異なる方向に歩いているとします。 2つのオープンパスは、バイナリの結果です。 2人の合理的なアクターが互いに競合しない異なるバイナリ結果を選択した場合、彼らは互いに通り過ぎて挨拶します。 競合する2つのバイナリ結果を選択した場合、それらは同じ空間を歩いており、そのうちの1つは譲歩する必要があります。
上記の例で、2人の合理的なアクターが2つの互換性のある結果と矛盾しない結果を選択した場合、一般的なコンセンサスは、他の人が自分の戦略を変更しない場合、戦略(この場合は歩行方向)を変更してもどちらも得られないということです。
上記は、任意の機械学習構造でモデル化できる平衡を構成します。 この単純な例を考えると、結果は常に協力する2人の合理的な俳優、つまり言い換えれば、お互いを通り過ぎる2人の人間になります。
反対は「不均衡」と呼ばれる可能性があります。2つの合理的な行為者が矛盾する結果を選択した場合、前述のように、どちらか一方が譲歩しなければなりません。 ただし、これをモデル化するMLプログラムは、両方が譲歩することに決めた場合、無限ループに投げ込まれる可能性があります。
上記のような均衡は、一般的にコンセンサスを作成し、モデルを安定させるために機械学習で使用されます。 エンジニアと開発者は、均衡の恩恵を受けるシナリオと状況を探し、そうでないものを変更または処理するように働きます。 ML平衡に対応する実世界の例を見ると、合理的なアクターとエージェントを作成して人間の行動をモデル化する方法を見つけるために、機械学習システムでこの種の分析がどのようにユニークで有益であるかを簡単に確認できます。 これは、機械学習システムの応用を進歩させるために均衡をどのように使用できるかの優れた例の1つにすぎません。