目次:
定義-Apache Avroはどういう意味ですか?
Apache Avroは、Apache Hadoopプロジェクト内で開発されたデータシリアル化およびリモートプロシージャコールフレームワークであり、永続データを取得するためのシリアル化形式と、Hadoopノード間の通信を提供するワイヤ形式の両方を提供し、クライアントプログラムをHadoopに接続しますサービス。
Avroはプロトコルとデータ型の定義にJSON形式を使用し、データをコンパクトなバイナリ形式にシリアル化します。
TechopediaはApache Avroについて説明します
Apache Avroは、コード生成やプロキシオブジェクトを必要としないコンパクトなバイナリ形式でデータを生成するビッグデータシリアル化フレームワークです。
Apache Hadoopのデータシリアル化コンポーネントとして使用されます。 Avroはスキーマの概念に取り組んでいます。 Avroデータの読み取り中は、その特定のデータの書き込み中に使用されたスキーマが常に存在します。
これにより、値ごとのオーバーヘッドなしで各データセットが可能になり、シリアル化が高速になり、サイズが比較的小さくなります。 また、データとそのスキーマは完全に自己記述的であるため、動的スクリプト言語で簡単に使用できます。
Avroデータが特定のファイルに保存されると、スキーマも一緒に保存され、後で別のプログラムで処理されます。 したがって、データを読み取るプログラムが別のスキーマを予期している場合、両方のスキーマが存在するため、これは簡単に解決できます。
Avroが提供するもの:
コンパクトで高速なバイナリデータ形式
豊富なデータ構造
永続データを保存するためのコンテナファイル
リモートプロシージャコール(RPC)
動的言語との統合
コードの生成は、データファイルの読み取りまたは書き込み、またはRPCプロトコルの使用または実装の要件ではありません。










