目次:
定義-データラングリングとはどういう意味ですか?
データラングリングは、分析と使用の目的でサービス指向アーキテクチャ(SOA)に入る必要がある、大きくて乱雑で多様なデータセットを導入する新しいソフトウェア機能から生じる特定のタイプのデータ管理です。 一般的に、データラングリングには、不規則なデータや多様なデータを処理し、ビジネスユースケースに合わせて操作するためのさまざまな高度な手法が含まれます。
Techopediaがデータラングリングについて説明します
非公式の用語のように聞こえるかもしれませんが、データの乱闘は実際にデータ管理の特定のスペースを占有します。 データラングリングを理解するための便利な方法の1つは、より正式な抽出、変換、およびロード(ETL)方法論と比較することです。 データラングリングには、ETLとは異なる側面とユースケースがあります。 多くの場合、熟練したデータサイエンティストまたはパイプラインに近い他の人によって行われます。 ある意味では、データを扱うエンジニアは、より「実践的」であるか、より多くの手動の抽出方法を使用するため、データラングリングは「オープンソース」ETLの一種と呼ばれます。
多様なデータを選別してソートし、エンタープライズアーキテクチャに取り込む洗練されたプロセスを本当に理解している人にとって、データの乱闘は実際には非常に重要なトピックです。 ITプロフェッショナルは、膨大な数のツール、リソース、および手法を使用して、乱雑な生データまたは非構造化データから価値を引き出します。