目次:
定義-光学式文字認識(OCR)とはどういう意味ですか?
光学式文字認識(OCR)とは、入力、印刷、または手書きの文字を読み取り、機械でエンコードされたテキストまたはコンピューターで操作できるものに変換する技術とプロセスの両方を指します。 これは、画像認識のサブセットであり、銀行取引明細書、販売請求書、パスポート、履歴書、名刺などの何らかの印刷ドキュメントまたはデータレコードを入力とするデータ入力の形式として広く使用されています。 文書がスキャンされるか、写真が撮影され、文字を認識してテキスト文書の形式で出力するかどうかはプログラム次第です。
Techopediaは光学式文字認識(OCR)について説明します
光学式文字認識とは、既にコンピューターで読み取り可能な画像を分析することにより、コンピューターが言語固有の文字を認識することです。 これは、多くの場合、最初にドキュメントの画像をスキャンするか、デジタル写真を撮影することで行われます。 これにより、コンピューターが理解するデータで構成されたラスターイメージが作成され、人工知能の分野でそのほとんどが使用されている特別にプログラムされたアルゴリズムにより、コンピューターはイメージ内のパターンを認識します。この場合、パターンは文字です。 次に、プログラムは、入力イメージから認識された文字に相当する文字コード(通常はASCII)を作成または出力します。 ほとんどのOCRプログラムは、文字の認識を向上させるためにトレーニングする必要があります。
