目次:
定義-データサイエンスプラットフォームの意味
データサイエンスプラットフォームは、データサイエンス作業を実施するための環境であり、通常、コーディングとコードモデルの展開、およびさまざまなソースからのデータの集約と使用が含まれます。 データサイエンスプロジェクトは、この種のビッグデータ作業の「ソフトウェアハブ」と呼ばれることが多い中央データサイエンスプラットフォームの恩恵を受けます。
Techopediaがデータサイエンスプラットフォームを説明
データサイエンスプラットフォームは、さまざまな方法で設定できます。 それらの多くは、仮想マシンやコンテナー仮想化などの近代化の原則を活用しており、データサイエンスプラットフォームは、開発者がモジュール環境でアプリケーションやコードベースを操作できる設計要素に対応しています。 データサイエンスの研究は、Apache Hadoopなどのテクノロジーや、データ処理およびデータライフサイクルのためのその他のクラスタリングおよびモジュラーシステムの使用によっても進化しています。
データサイエンスプラットフォームの課題の一部は、ツールがどのようにサポートされるかを決定し、一部が「ツールスプロール」と呼ぶものを制御することであり、これはマイナス要因になる可能性があります。