トレンド 機械学習のバイアスと分散を記述する簡単な方法は何ですか?

機械学習のバイアスと分散を記述する簡単な方法は何ですか?

Anonim

Q:

機械学習のバイアスと分散を記述する簡単な方法は何ですか?

A:

機械学習のバイアスと分散を説明する複雑な方法はいくつもあります。 それらの多くは、非常に複雑な数学の方程式を利用し、グラフを通して特定の例がバイアスと分散の両方のさまざまな量をどのように表すかを示しています。

機械学習におけるバイアス、分散、およびバイアス/分散のトレードオフを説明する簡単な方法を次に示します。

本質的に、バイアスは単純化しすぎです。 バイアスの定義に、何らかの仮定または想定誤差を追加することが重要になる場合があります。

非常に偏った結果がエラーにならなかった場合-それがお金にあった場合-それは非常に正確でしょう。 問題は、単純化されたモデルにいくらかのエラーが含まれているため、大した目ではないということです。機械学習プログラムが機能するにつれて、重大なエラーが繰り返されたり増幅されたりします。

分散の簡単な定義は、結果が散らばっているということです。 これにより、プログラムが複雑になり、テストセットとトレーニングセットの間に問題が生じることがよくあります。

分散が大きいということは、小さな変更が出力または結果に大きな変更をもたらすことを意味します。

分散を簡単に説明する別の方法は、モデルにノイズが多すぎるため、機械学習プログラムが実際の信号を分離して識別するのが難しくなることです。

したがって、バイアスと分散を比較する最も簡単な方法の1つは、機械学習エンジニアが過度のバイアスまたは単純化と、過度の分散または過度の複雑さとの間の細かい線をたどることを提案することです。

これをうまく表現する別の方法は、高分散と低分散のすべての組み合わせを示す4象限グラフを使用することです。 低バイアス/低分散象限では、すべての結果が正確なクラスターにまとめられます。 高バイアス/低分散の結果では、すべての結果が不正確なクラスターに集められます。 低バイアス/高分散の結果では、結果は正確なクラスターを表す中心点に散らばりますが、高バイアス/高分散の結果では、データ点は散在し、全体として不正確です。

機械学習のバイアスと分散を記述する簡単な方法は何ですか?