目次:
定義-読み取りスキーマはどういう意味ですか?
読み取り時のスキーマとは、Hadoopやその他のより複雑なデータベーステクノロジーなどの新しいデータ処理ツールにおける革新的なデータ分析戦略を指します。 読み取り時のスキーマでは、データは、格納される場所からではなく格納された場所から引き出されるときに、プランまたはスキーマに適用されます。
Techopediaは読み取り時のスキーマについて説明します
古いデータベーステクノロジーには、書き込み時のスキーマの強制戦略がありました。つまり、データがデータベースに入るときに、データを計画またはスキーマに適用する必要がありました。 これは、データの一貫性を強化するために部分的に行われました。これは、書き込み時のスキーマの主な利点の1つです。 スキーマが読み取りの場合、データを処理する人は各データを識別するためにより多くの作業を行う必要がありますが、より多くの汎用性があります。
基本的に、スキーマオンリード設計は、Hadoopおよび関連ツールの主な用途を補完します。 企業は、大量のデータを効果的に集約し、特定の用途のために保存したいと考えています。 とはいえ、厳格なデータ実施計画よりも、汚れたデータや一貫性のないデータの収集を重視する場合があります。 言い換えれば、Hadoopは、完全に編成されていない可能性のあるさまざまな小さなデータの広い範囲の取得に対応できます。 次に、その情報が使用されると、整理されます。 古いデータベーススキーマオンライトシステムを適用すると、組織化されていないデータが破棄される可能性があります。
別の言い方をすれば、非常にクリーンで一貫性のあるデータセットを取得するには、書き込み時のスキーマの方が適していますが、これらのデータセットはより制限される可能性があります。 読み取りのスキーマは、より広いネットをキャストし、より汎用性の高いデータの編成を可能にします。 また、専門家は、読み取り時にスキーマを使用して同じデータの2つの異なるビューを作成する方が簡単だと指摘します。
このスキーマオンリード戦略は、Hadoopと関連テクノロジーが今日のエンタープライズテクノロジーで非常に人気がある理由の1つの重要な部分です。 企業は、企業データウェアハウスやその他の大きなデータ資産を含むファジーロジックやその他の並べ替えおよびフィルタリングシステムを適用することにより、大量の生データを使用してあらゆる種類のビジネスプロセスを強化しています。
