目次:
定義-Apache Kafkaの意味?
Apache Kafkaは、リアルタイムデータフィードの迅速でスケーラブルでフォールトトレラントな処理を提供するように設計された、オープンソースのパブリッシュ/サブスクライブメッセージシステムです。 従来のエンタープライズメッセージングソフトウェアとは異なり、Kafkaは会社を流れるすべてのデータを処理し、ほぼリアルタイムで処理できます。
KafkaはScalaで書かれており、もともとLinkedInによって開発されました。 それ以来、多くの企業がこのプラットフォームを使用してリアルタイムプラットフォームを構築してきました。
TechopediaはApache Kafkaを説明します
Kafkaはトランザクションログと多くの類似点があり、トピックのメッセージのフィードを維持します。 プロデューサーはトピックにデータを書き込み、コンシューマーはそれらのトピックから読み取ります。これらのデータは、分散システム形式で複数のノードに分割および複製されます。 Kafkaは、各トピックパーティションをログとして扱い、パーティション内の各メッセージに一意のオフセットが割り当てられるという点でユニークです。 すべてのメッセージを一定期間保持し、消費者は各ログの場所を追跡する責任があります。 これは、ブローカーがこの追跡を担当していた以前のシステムとは異なり、消費者の数が増えるにつれてシステムの拡張能力が大幅に制限されていました。 この構造により、Kafkaは多くの消費者をサポートし、非常に低いオーバーヘッドで大量のデータを保持できます。
Kafkaを使用できます:
- 従来のメッセージブローカーとして
- ウェブサイトのアクティビティ追跡
- ログ集約用
- ビッグデータストリーム処理用
Kafkaは、Apache Storm、Apache HBase、およびApache Sparkと一緒に使用して、ストリーミングデータのリアルタイム分析とレンダリングを行うことができます。
