イットビジネス データサイエンティストを育てる方法

データサイエンティストを育てる方法

Anonim

テクノロジーの新興企業の中で、データサイエンティストは、データインテリジェンスの伝統的に別々の機能領域をつなぐことができるデータオタクを指すために使用されるますます一般的な用語です。 データサイエンティストは、データインテリジェンスプロジェクトのいくつかの(すべてではないにしても)側面を快適に実行できる人です。

  1. データ取得:これには、特定のWebサービスまたは非伝統的なデータソースのAPIをターゲットとするカスタムパーサーおよびWebクローラーまたはスクリプトの記述が必要になる場合があります。
  2. データ管理:データベース、キー値ストア、またはHadoopのデータのETL、操作、クエリ、および保守。
  3. 情報の視覚化:静的な視覚化ツールキットやFlash、JavaScript、Processingに基づいたインタラクティブプラットフォームを使用してパターンを発見します。
  4. 分析:これは、多変量統計、機械学習、NLPの単純なテクニックから複雑なテクニックまでさまざまです。
  5. 洞察:主要な調査結果を抽出し、要約し、幅広い聴衆に提示します。

多くのツール、スキル、技術的な詳細があり、上記の各アイテムを習得するには何年も費やすことができます。 データサイエンティストは、どの分野でも真の専門知識を有していない場合がありますが、前後にスキップしてすべての分野で基本的なタスクを実行するのは問題ありません。 その結果、データプロジェクトを迅速に調査し、経営陣からの(高レベルの)質問に対する回答を作成するのに十分な軽快なデータオタクが得られます。 (データサイエンティストのデータサイエンティストについて:テックワールドの新しいロックスター。)

データサイエンティストを育成するには、企業は文化と組織構造にもっと集中する必要があります。 多くのデータワーカーは、データインテリジェンスの複数の領域ですぐに生産性を上げるのに十分なスキルとトレーニングを持っています。 問題は、ほとんどがデータサイエンティストになることを奨励する環境では機能しないことです。 それらはサイロに閉じ込められており、データインテリジェンスの1つまたは2つの領域に限定されています。 多くの場合、彼らはマネージャーによって「承認された」ツールの使用に制限されています。

データサイエンティストを育てる方法