Q:
学習エージェントはどのようにして「Webを使用することを学ぶ」ことができますか?
A:機械学習(ML)と人工知能(AI)の進歩の最も説得力のある個々の例の1つは、MLアルゴリズムで実際にWebをナビゲートし、特定のページ内機能をほぼ同じように使用するデジタル「学習エージェント」を含みます人間が行う方法。
より高度な機械学習プロセスの力により、コンピューターは画像を「見る」ことができ、その意味を解読できるようになりました。 エンジニアは、驚異的なレベルの粒度でAIテクノロジーをプログラミングできました。つまり、コンピューターは高度なリテラシーでビジュアルページからテキストを「読み取る」ことができるという意味です。 これには、文字、数字、テキスト文字の形状を認識するために生のピクセル入力を使用し、自然言語処理を使用してこれらの文字をつなぎ合わせてコマンドと応答を作成するために、膨大なリソースが必要です。
ただし、学習エージェントの改善へのもう1つの主要な経路は反復です。 これらのプログラムは、人間の観点から正しいことを行うために本質的に「トレーニング」されており、トレーニングセットに従って機能を改善します。
このすべての進歩の優れた例は、小さなWebページで生のピクセルのセットを知覚し、「キーボードとマウスのアクションを生成できる」強化学習エージェントについて説明しているOpenAIの「ビットの世界」ページにあります。
Webユーザーは、これらのキーボードイベントとマウスイベントを小さなWebページ上のユーザーのような動きで出力するテクノロジーを見ることができます。ドロップダウンリストボックスの操作、ロジックのチェックボックス、テキスト入力への応答、色の選択など。 OpenAIは、「トレーニング環境で事前トレーニングを無制限に利用できる」と述べています。
これらはすべて、人工知能と機械学習が急速に進歩しており、これを維持するには人間の反応が必要であることを示しています。 ユーザーが「ロボットではない」ことを証明するためにWebページに組み込まれた種類のroteテクノロジーは、人工知能が基本的に私たちが作成したペンの一部を回避するため、効果を上げるために大幅にアップグレードする必要があります。 同時に、AIエージェントがWebを有意義な方法で使用できるようにするエキサイティングなアプリケーションセットがあります。これまで、人々は人工知能を使用して推奨エンジンを改善したり、結果を得るためにWebサーフィンをしたりすることについて話してきました。 現在、これらの同じ人工知能エージェントを使用して、Web上のコントロールを操作することもできます。
