目次:
- すべてのビジネスセクションをビッグデータイニシアチブに関与させる
- ビッグデータ実装のためのすべてのインフラストラクチャモデルを評価する
- ビッグデータ計画では従来のデータソースを考慮してください
- 一貫したデータのセットを検討してください
- データを配布する
- 単一のビッグデータ分析アプローチに依存しないでください
- 準備が整う前に大規模なビッグデータイニシアチブを開始しないでください
- データを単独で使用しないでください
- データセキュリティを無視しないでください
- ビッグデータ分析のパフォーマンスの部分を無視しないでください
ビッグデータは、あらゆるタイプの産業に多くの可能性をもたらします。 このビッグデータが効果的かつ効率的に活用されると、意思決定と分析に大きな影響を与える可能性があります。 しかし、ビッグデータの利点は、構造化された方法で管理されている場合にのみ達成できます。 ビッグデータのベストプラクティスは徐々に確立されつつありますが、実装に関してはすでにいくつかの明確なすべきことがあります。
次のガイダンスは、実際のプロジェクトから収集した実践的な経験と知識に基づいています。 ここに私のトップビッグデータの長所と短所を示します。
すべてのビジネスセクションをビッグデータイニシアチブに関与させる
ビッグデータイニシアチブは、独立した独立した活動ではありません。真の価値と洞察を得るには、すべてのビジネスユニットの関与が不可欠です。 ビッグデータは、組織が大量のデータを活用し、顧客の行動、イベント、トレンド、予測などの洞察を得るのに役立ちます。これは、ビッグデータで処理されるデータ全体の一部のみをキャプチャするデータスナップショットでは不可能です。 その結果、企業は、正しいパターンを理解するために、あらゆる可能性のある通り/事業単位から来るすべてのタイプのデータにますます集中している。ビッグデータ実装のためのすべてのインフラストラクチャモデルを評価する
データの量とその管理は、ビッグデータのイニシアチブにとって大きな懸念事項です。 ビッグデータはペタバイトのデータを扱うため、それを管理する唯一のソリューションはデータセンターを使用することです。 同時に、ストレージ施設を選択して最終決定する前に、コスト要素を考慮する必要があります。 多くの場合、クラウドサービスが最良の選択ですが、適切なサービスを決定するには、さまざまなクラウド環境のサービスを評価する必要があります。 ストレージは、ビッグデータの実装において最も重要なコンポーネントの1つであるため、ビッグデータイニシアチブでは非常に慎重に評価する必要がある要素です。 (今日のビッグデータチャレンジのさまざまな観点から、ボリュームや速度ではなく、別の視点を獲得してください。)ビッグデータ計画では従来のデータソースを考慮してください
ビッグデータにはさまざまなソースがあり、ソースの数も日々増加しています。 この膨大なデータは、ビッグデータ処理への入力として使用されます。 その結果、一部の企業は、従来のデータソースは役に立たないと考えています。 この従来のデータは、ビッグデータのストーリーを成功させるための重要なコンポーネントであるため、これは真実ではありません。 従来のデータには貴重な情報が含まれているため、他のビッグデータソースと組み合わせて使用する必要があります。 ビッグデータの真の価値は、すべてのデータソース(伝統的および非伝統的)が考慮される場合にのみ導き出すことができます。 (Take That、ビッグデータで詳細をご覧ください!小さなデータが大きなパンチを詰め込む理由一貫したデータのセットを検討してください
ビッグデータ環境では、データはさまざまなソースから来ています。 データの形式、構造、およびタイプは、ソースごとに異なります。 最も重要な部分は、ビッグデータ環境に関してはデータがクリーンアップされないことです。 そのため、着信データを信頼する前に、繰り返し観測と分析を行って一貫性を確認する必要があります。 データの一貫性が確認されると、一貫したメタデータのセットとして扱うことができます。 パターンを注意深く観察して一貫性のあるメタデータのセットを見つけることは、ビッグデータの計画に不可欠な演習です。データを配布する
データ量は、処理環境を検討する際の大きな懸念事項です。 ビッグデータが扱う膨大なデータのため、単一のサーバーでの処理は不可能です。 ソリューションはHadoop環境です。これは、市販のハードウェアで実行される分散コンピューティング環境です。 これにより、複数のノードでより高速な処理が可能になります。 (Hadoopについて知っておくべき7つのことで詳細を確認してください。)単一のビッグデータ分析アプローチに依存しないでください
ビッグデータを処理するためのさまざまな技術が市場で利用可能です。 すべてのビッグデータテクノロジーの基盤は、Apache HadoopとMapReduceです。 したがって、正しい目的のために正しいテクノロジーを評価することが重要です。 重要な分析アプローチには、予測分析、規範的分析、テキスト分析、ストリームデータ分析などがあります。適切な方法/アプローチを選択することは、目的を達成するために重要です。 単一のアプローチに依存するのを避けることが最善ですが、さまざまなアプローチを調査し、ソリューションに完全に一致するものを選択します。準備が整う前に大規模なビッグデータイニシアチブを開始しないでください
ビッグデータイニシアチブでは、常に小さな手順から始めることをお勧めします。 そのため、パイロットプロジェクトから始めて専門知識を得てから、実際の実装に進みます。 ビッグデータの可能性は非常に印象的ですが、実際の価値は、間違いを減らして専門知識を増やして初めて達成できます。データを単独で使用しないでください
ビッグデータソースは私たちの周りに散らばっており、日々増加しています。 正しい分析出力を得るには、これらのデータをすべて統合することが重要です。 データ統合用のさまざまなツールが市場で入手できますが、使用前に適切に評価する必要があります。 さまざまなソースからのデータはさまざまな形式であるため、ビッグデータの統合は複雑なタスクですが、良好な分析結果を得るためには非常に必要です。データセキュリティを無視しないでください
ビッグデータの計画では、データセキュリティが重要な考慮事項です。 最初(処理を行う前)、データはペタバイト単位であるため、セキュリティは厳密には実装されていません。 ただし、ある程度の処理を行うと、ある程度の洞察を提供するデータのサブセットを取得できます。 この時点で、データセキュリティが不可欠になります。 データがより多く処理され、微調整されるほど、組織にとってより価値のあるものになることがよくあります。 この微調整された出力データは知的財産であり、保護する必要があります。 データセキュリティは、ビッグデータのライフサイクルの一部として実装する必要があります。ビッグデータ分析のパフォーマンスの部分を無視しないでください
ビッグデータ分析の出力は、優れたパフォーマンスを提供する場合にのみ役立ちます。 ビッグデータは、大量のデータを高速で処理することに基づいてより多くの洞察を提供します。 したがって、効果的かつ効率的に管理することが不可欠です。 ビッグデータのパフォーマンスを慎重に管理しないと、問題が発生し、労力全体が無意味になります。
私たちの議論では、ビッグデータのイニシアチブの禁止事項と禁止事項に焦点を合わせました。 ビッグデータは新興分野であり、実装に関しては、多くの企業がまだ計画段階にあります。 リスクとミスを最小限に抑えるには、ビッグデータのベストプラクティスを理解することが不可欠です。 ディスカッションポイントはライブプロジェクトの経験に基づいているため、ビッグデータ戦略を成功させるためのガイドラインを提供します。
