オーディオ Sparkが将来のビッグデータプラットフォームである理由

Sparkが将来のビッグデータプラットフォームである理由

目次:

Anonim

Apache Hadoopは、長い間ビッグデータアプリケーションの基盤であり、すべてのビッグデータ関連製品の基本的なデータプラットフォームと考えられています。 ただし、パフォーマンスの高速化と結果の迅速化により、インメモリデータベースと計算の人気が高まっています。 Apache Sparkは、メモリ内機能を利用して高速処理(Hadoopのほぼ100倍)を提供する新しいフレームワークです。 そのため、Spark製品は、ビッグデータの世界で、主に高速処理のためにますます使用されています。

ウェビナー:提案の力:データカタログがアナリストを強化する方法

ここに登録

Apache Sparkとは

Apache Sparkは、膨大な量のデータ(ビッグデータ)を迅速かつ簡単に処理するためのオープンソースフレームワークです。 ビッグデータに基づく分析アプリケーションに適しています。 Sparkは、スタンドアロンまたはクラウドのHadoop環境で使用できます。 カリフォルニア大学で開発され、その後Apache Software Foundationに提供されました。 したがって、それはオープンソースコミュニティに属し、非常に費用対効果が高く、さらにアマチュア開発者が簡単に作業できるようになります。 (Hadoopのオープンソースの詳細については、Apache Hadoopエコシステムに対するオープンソースの影響とはを参照してください。)

Sparkの主な目的は、中心となるデータ構造を回避するアプリケーションフレームワークを開発者に提供することです。 また、Sparkは非常に強力であり、短い時間で大量のデータを迅速に処理する固有の機能を備えているため、非常に優れたパフォーマンスを提供します。 これにより、最も近い競合他社であると言われているHadoopよりもはるかに高速になります。

Sparkが将来のビッグデータプラットフォームである理由