目次:
構造化、非構造化、または半構造化された大量のデータのキャッチーな名前であるビッグデータは、少なくとも従来のデータベースおよびソフトウェアアプリケーションを使用して、キャプチャ、保存、管理、共有、分析、視覚化することが難しいことで有名です。 そのため、ビッグデータテクノロジーには、大量のデータを効果的かつ効率的に管理および処理できる可能性があります。 そして、Apache Hadoopがフレームワークと関連テクノロジーを提供し、分散した方法でコンピューターのクラスター全体で大規模なデータセットを処理します。 そのため、ビッグデータを本当に理解するには、Hadoopについて少し理解する必要があります。 ここでは、Hadoopに関してよく聞く用語とその意味を見ていきます。
ウェビナー:Big Iron、Meet Big Data:Hadoop&Sparkを使用したメインフレームデータの解放 ここに登録 |
しかし、まず、Hadoopの仕組みを見てみましょう
Hadoopエコシステムに入る前に、2つの基本的なことを明確に理解する必要があります。 1つ目は、Hadoopでのファイルの保存方法です。 2つ目は、保存されたデータの処理方法です。 Hadoop関連の技術はすべて、主にこれら2つの領域で機能し、より使いやすいものになっています。 (Hadoopがビッグデータ問題の解決にどのように役立つかで、Hadoopの仕組みの基本を学んでください。)
次に、条件について説明します。