Q:
どのビッグデータソリューションを実装するかを決定するとき、どのような考慮事項が最も重要ですか?
A:すべてのビジネスと組織は、ビッグデータの実装にとって最も重要な問題を特定する際に、独自のニーズとリソースを考慮する必要があります。 ただし、この種のテクノロジーの採用には一般的に重要と考えられる多くの原則があります。
ウェビナー:Big Iron、Meet Big Data:Hadoop&Sparkを使用したメインフレームデータの解放 ここに登録 |
最大の疑問の1つは、実装とそれが引き起こす混乱の量です。 ビッグデータシステムのユーザーは、使用しようとしているものと現在使用しているものを常に比較する必要があります。 多くの場合、ビッグデータリソースが生産性と利益を高めるか、実装の乗り越えられないハードルのためにビジネスをクラッシュさせるかどうかの決定要因は、混乱です。 ベンダーのサポート(またはそれの欠如)はこれと多くの関係がありますが、企業はテクノロジーの学習曲線、レガシーシステムの運用をどれだけ変更するか、一般的には変更が何か企業が処理できます。
もう1つの大きな疑問は、どのデータがビジネスや組織にとって最も価値があるかです。 さまざまなデータセットの価値を調べることで、ビッグデータを実装しようとする人はプロジェクトの範囲を設定できます。 これらの種類のガイドラインがなければ、ビッグデータプロジェクトは企業で肥大化して圧倒される可能性があります。 専門家は、より広いネットをキャストすることに動揺することなく、最大の価値をもたらす特定のデータセットに注目することをお勧めします。
ここでの当然の問題は、構造化データと非構造化データの使用です。 ビジネスリーダーは、データセンターのようなビッグデータコンテキストにさまざまなデータを取り込む難しさのレベルを調べることができます。 たとえば、既にフォーマットされたデータセットは簡単にダイジェストできますが、他のデータの一部は、それらを有用なフォーマットにするには広範な操作が必要な場合があり、価値がない場合があります。
採用者は、ビッグデータの高度な処理にも目を向ける必要があります。 ビッグデータシステムは、基本的でシンプルなハードウェアおよびソフトウェアインフラストラクチャでは処理が困難なものとして定義されています。 つまり、採用者は、ネットワークの輻輳を引き起こしたり、運用にボトルネックを作ったりしないビッグデータセットを使用する方法を見つけるために、十分な人材とリソースを用意する必要があります。
