オーディオ あらゆる場所に分析を埋め込む:市民のデータ科学者を可能にする

あらゆる場所に分析を埋め込む:市民のデータ科学者を可能にする

Anonim

Techopediaスタッフ、2016年8月25日

持ち帰り:ホストのレベッカ・ジョズウィアックは、組み込み分析の現象と市民データ科学者について、ロビン・ブロア博士、デズ・ブランフィールド、デビッド・スウィナーと議論します。

ビデオを見るには、このイベントに登録する必要があります。 登録してビデオをご覧ください。

Rebecca Jozwiak:ご列席の皆様 、こんにちは。HotTechnologiesへようこそ。 「どこにでも埋め込む:市民データ科学者を可能にする」が今日の私たちのトピックです。 私はあなたのいつものホストのために記入します、これはエリック・カバナのために記入するレベッカ・ジョズウィアックです。 はい、今年は暑いです。 特に「データサイエンティスト」という用語は、「統計学者」や「分析の専門家」などの退屈な名前と呼ばれていましたが、同じ種類の活動にほとんど取り組んでいますが、セクシーな新しい名前が付けられ、多くの注目を集めています。 彼らは職場にいることが非常に望ましく、組織にとって有益であり、誰もがそれを望んでいます。 しかし、それらは次のとおりです。1)高価、2)見つけにくい。 確かに、データサイエンティストのスキル不足に関するニュースはあちこちにありますが、それでも組織に大きな価値を提供しており、人々はダイムを落とさずにその価値を得る方法を見つけ出すことを求めています話す。

しかし、良いニュースは、その不足を補うようなツールやソフトウェアが出てきていることです。 自動化、機械学習、組み込み分析があり、これが今日学んでいくことであり、この新しい用語「市民データ科学者」が生まれたのはどういう意味ですか? いいえ、トレーニングを受けたデータサイエンティストではなく、ビジネスユーザー、BIエキスパート、IT担当者、バックグラウンドを持っているが必ずしも専門知識は持っていない可能性があります。 しかし、これらのツールとソフトウェアは、ディープコーディングを知らなくても、より多くの人々がスマートソリューションにアクセスできるようにします。 しかし、すべての人がその分析的思考に少しでもアクセスできるようにすると、全体的なパフォーマンスの向上に役立ちます。 あなたの会社にとって良い洞察につながるような好奇心を持つために、必ずしもトレーニングを受ける必要はありません。

今日私たちと話し合っているのは、Bloor Groupのチーフアナリスト、Robin Bloorであり、データ科学者であるDez Blanchfieldが電話をかけ、Dell StatisticaのDavid Sweenorが本日プレゼンテーションを行います。 そして、それで私はそれをロビン・ブロアに渡すつもりです。

Robin Boor:わかりました、その紹介に感謝します。 私はこれについて歴史的な文脈で考えました。 ここで実際に見ているのは、レオナルド・ダ・ヴィンチが人間が背中に乗せるようなグライダーのデザインの一つです。 実際に機能するかどうかはわかりません。 私はそれに入らないだろう、と言わざるを得ない。 しかし、ダ・ヴィンチは、私がダ・ヴィンチについて考えるときはいつでも、彼がこれまでに存在した中で最も探究的で分析的な人々の一人だと思います。 そして、グライダーを見るだけで、鳥の翼に基づいて設計されており、グライダーはそれを構築するために何らかの方法で鳥の飛行を研究したことは明らかです。

歴史的な観点から見ると(実際に調べたところ)、分析はおそらく最も古い数学の応用でしょう。 少なくともバビロニア時代にさかのぼる国勢調査があります。 基本的に、そのようなデータを持っている楔形のタブレットがいくつかあるので、これについて知っています。 以前に戻ったものがあるかどうかはわかりません。 しかし、明らかなことは、あなたは自分自身に多くの人々がいる文明を持っているということです。それは実際に計画を必要とし、あなたが何を計画していて、それらの人々の要件が実際に何であるかを知る価値があります。

そして、それが一種の始まりであり、初期のコンピューター、初期の機械式コンピューターが実際にあったため、コンピューティングが始まった場所でもあります。最初は、IBMになったホレリスによって作成された国勢調査だったと思います。 これらはすべて前進しています。 おそらく1970年代から現在までの間に何らかの種類の幕間がありましたが、そこには他にも膨大な数のアプリケーションや分析があり、後部座席に座っていたと言えます。 はい、分析が行われていました-特に銀行や保険会社、そして実際にはGeneral Electricやtelcoなどの大規模な組織で行われていましたが、ビジネス全体では一般的に使用されていませんでしたが、現在では一般的に使用され始めていますビジネス。 そして、それは本当にゲームを変えました。 私が最初に注目したいと思ったのは、私が特に気に入っているデータピラミッドです。 これは、20年前-少なくとも20年前-の1つを描いて、理解しようとしたことです。当時、私はBIと初期のデータマイニングを理解しようとしていました。 ここで定義したのはデータの概念であり、例は信号、測定、記録、イベント、トランザクション、計算、集計、個々の情報ポイントです。 あなたはそれらを情報の分子と考えるかもしれませんが、それらは個々のポイントです。 コンテキストを取得するとすぐに情報になります。 リンクされたデータ、構造化されたデータ、データベース、データの視覚化、プロッター、スキーム、およびオントロジー-これらはすべて、情報として資格があります。実際に形、数学的な形を持っているもの。

その上、私たちは知識を持っています。 情報を調べることで、さまざまなパターンがあることを知ることができ、ルール、ポリシー、ガイドライン、手順を定式化することでそれらのパターンを活用し、知識の形をとることができます。 そして、ほとんどすべてのコンピュータープログラムは、彼らがやろうとしていることは何でも、一種の知識です。なぜなら、彼らはデータに対して働き、それらにルールを適用しているからです。 これらの3つのレイヤーがあり、レイヤー間でさらに洗練が進んでいます。 また、この図の左側には、新しいデータが入力されていることが示されているため、これらの多くは静的です。 データは蓄積され、情報は蓄積され、知識は潜在的に成長しています。 最上部には「理解」があり、哲学的な議論ではありますが、理解は人間にのみ存在するということを維持します。 私がそれについて間違っている場合、私たちはいつかはコンピューターに置き換えられます。 しかし、議論をするのではなく、次のスライドに進みます。

これを見てみると、興味深いことですが、これは最近のことです。興味深いことは、分析が実際に何であるかを理解することでした。 そして最終的には、さまざまな図を描いて、このように見える図を作成することで、実際には、分析開発は非常に多くの数式を使用した単なるソフトウェア開発であるという結論に達しました。 分析的調査は、実際に多くの異なるモデルを使用して調査し、データに関する新しい知識を生成するという意味で、ソフトウェア開発とは少し異なります。 しかし、生成した後は、受動的意思決定支援と考えられるもののいずれかで実装されます。これは、ユーザーに与えられた情報です。 対話型の意思決定支援。OLAPのようなもので、ユーザーはさまざまなツールを使用して自分で物事を調査および推測できる構造化されたデータのセットをユーザーに提供します。 多くの視覚化はそのようなものです。 そして、収集した分析的洞察を実装可能な一連のルールに変えることができれば、自動化が行われます。必ずしも人間が関与する必要はありません。 それは私がそのすべてをしたときに私がそれを見ていたような方法です。 そして、私にはさまざまなことが起こり始めました。 アクティビティの領域になったら、データのドメインが実際にマイニングされ、徹底的にマイニングされ、あらゆる可能な方向で徹底的に探索され、最終的には結晶化されたBIになります。 発明された知識は、さまざまな方法でさまざまなユーザーに情報を提供する知識になり始め、願わくば、彼らが行う仕事を実際に行う能力を高めます。

私が気づき、予測分析を約5年間見てきたことの1つですが、予測分析はBIになりつつあります。つまり、人々に情報を提供する有用な情報になりつつあり、既に指摘したように、自動化されたBIレポート、BI探索的、BI、非常に異なるグラデーション、予測分析が実際に3つのすべての方向に進んでいます。 そして、私が指摘した分析プロセスは、ソフトウェア開発とそれほど変わらず、わずかに異なるスキルを持つ異なる人々によって行われます。 本当に優れたデータサイエンティストを獲得するために必要なスキルは、取得するのに何年もかかることを強調する必要があると思います。 彼らは簡単に習得できず、多くの人がそれを行うことはできませんが、それは何が有効で何が有効でないかを知るために非常に洗練されたレベルで数学を理解することを伴うからです。 分析の開発、新しい知識の発見、分析の注入、それは知識を運用可能にすることです。 これが、分析全体に見られる背景です。 それは巨大な領域であり、多くの多くの次元がありますが、一般化はすべてに当てはまると思います。

次に、ビジネスの混乱があります。先ほど申し上げたように、多くの組織がありますが、製薬会社もDNAに分析を持っています。 しかし、実際にはDNAに含まれていない多くの組織があり、現在はその能力を備えており、ソフトウェアとハ​​ードウェアは以前よりもはるかに安価になり、今ではそれを活用できるようになりました。 多くのことを言います。 最初のことは、分析は多くの場合、研究開発であることです。 組織の特定の領域に分析を適用するだけで、何らかの方法で顧客の注文をさまざまな観点から分析し、他のデータと結合することは、ありふれたものに見えるかもしれません。 しかし、分析は実際に組織全体を見て、組織内で行われている特定のアクティビティやアクティビティのチェーン全体をほとんど分析する可能性を生み出します。 しかし、実際にその領域に移動したら、私はそれが研究開発だと主張します。 また、「会社が分析にいくら費やすべきか」という質問が何度かあります。それに答えるには、分析をR&Dと考えるのが最善の方法だと思います、「ビジネスの効率化の分野でR&Dにいくら費やしますか?」

そして、分析を行っていないビジネスには、知らないことがたくさんあります。 まず第一に、彼らはそれをする方法を知りません。 通常、組織内で実際に何らかの方法で分析を採用する場合、彼らはそれを行うのを支援できるコンサルタントに行くしか選択肢がありません。企業が実際にデータサイエンティストを雇い、1人を見つけ、1人に支払い、実際に彼らがやりたいことをすることを信頼します。 非常に難しい。 ほとんどの企業は、実際にこの作業を行うためにスタッフを雇用または教育する方法を知りません。その理由は、それがまだDNAに含まれていないため、自然なビジネスプロセスの一部ではないからです。 これは次のポイントにつながります。 彼らはそれをビジネスプロセスにする方法を知りません。 ちなみに、これを行うための最良の方法は、製薬会社や保険会社が見ているものをコピーすることです。ヘルスケアセンターの一部の会社は、分析を使用する方法を見てコピーすることです。 それはビジネスプロセスだからです。 ポリシングや監査の方法がわからない。 本当に、特に今では非常に多くのソフトウェア会社が非常に多くの分析を自動化する製品を作成しているためです。 監査についてのポイントは重要です。コンサルタントや現場に分析計算の結果が何であるかを理解できる信頼できる人がいる場合、それはあなたがしなければならない一種の選択ですが、本当に強力な分析ツールを分析を適切に理解していない人々の手は、正しくないかもしれない結論に飛びつく可能性があります。 そして、私が言ったように、企業はそれをどのように予算化するかを知らない。

これらはアナリティクスのフレーバーであり、私はそれらをただ実行します。 統計分析と統計モデリングは予測分析とは大きく異なり、そのほとんどは曲線近似です。 機械学習はこれらのものとは異なり、パス分析と時系列は基本的にステータスストリームで行われますが、これもまた異なります。 グラフ分析は再び異なり、テキスト分析とセマンティック分析は再び異なります。 これは、これが非常に多ジャンルなものであることを指摘しているだけです。 そうではなく、分析を開始するのではなく、抱えている問題に目を向け、それらに合ったさまざまなツールとさまざまな種類の分析を探します。 そして最後に、ネットネット。 ハードウェアとソフトウェアの進化のため、私の意見では、分析はまだ始まったばかりです。 まだまだたくさんありますが、今後数年間で展開されるでしょう。 私は今ボールをデズに渡すことができると思います。

Dez Blanchfield:ええ、従うべき厳しい行為について話してください、Robin。 私のお気に入りの角度の1つ、つまり人間の角度からこのトピックを簡単に見ていきます。 私たちの日常生活には非常に多くの変化が起こっています。 現在の私の見解では、私たちの日常生活における最大の混乱の1つは、毎日の仕事です。 仕事に戻り、あなたが雇う仕事をしようとしています。そして、日常の人からスーパーヒーローに行くことへの期待が高まり、組織の周りを流れ、非常に迅速に情報を発信しています。それは大きな挑戦であり、知識と情報の流れに対処するためのより良いツールを人々に提供しなければならないので、私は少し楽しい角度からこれに挑戦しようと思った。 しかし、それは常に私がこの高心やフラッシュモブなどを持っていることを私に衝撃を与えます、それは私たちが分析として話しているものに向かって私たちを駆り立てています彼らがそれと対話し、それが自然であり、普通に感じるような方法でそれを行うことができます。

そして実際、幼い子供、小さな赤ちゃんが床に座ってそこに座ってiPadで遊んでおり、それが飛び回って画像をつまんで絞り、動かしてスクリーンで遊んでいるというYouTubeビデオを思い出させますそこのデータ。 そして、親はiPadを取り出して、子供のひざの上に雑誌、印刷された雑誌を置きます。 そして、この子供はおそらく2歳以下です。 子供は、雑誌の画面でスワイプしようとし始め、ピンチして絞りますが、雑誌は反応しません。 子供は指を持ち上げてそれを見て、「うーん、指が機能しているとは思わない」と考えます。そして、それは腕で自分自身をつついて、「ああ、指が機能していると感じることができます。指がうごめくと、指がうごめいて反応します。 はい。 その後、マガジンと再びやり取りしようとしますが、ピンと押しつぶしたりスクロールしたりすることはありません。 それから彼らは雑誌を取り去り、iPadをひざに戻したが、突然すべてが機能した。 それで、ここに来て、娯楽のために分析ツールまたはライブストリーミングツールを使用するように訓練された赤ちゃんがいます。雑誌がどのように機能し、どのようにページをめくるかがわかりません。

そして、それ自体が興味深いコンセプトです。 しかし、組織内を移動する知識、データの流れ、人々の行動方法について考えるとき、人々がフラッシュ・モブであると学んだこと、それがどこで、どのソーシャル・メディアが作るかというこの概念をよく考えますこれはさらに簡単です。この日時にこの場所に移動し、これらのダンスをビデオで学び、この色の帽子をかぶって1時を北に向けるというアイデアです。 そして、あなたはこれをあなたのネットワークを通して押し出します、そして常に何百人もの人々が同じ場所で同時に同じことをします。そして、このすごい要因があります。しかし、実際にはそれは非常にシンプルなアイデアであり、シンプルなコンセプトがネットワークを介して押し出されているだけであり、視覚的に衝撃的で印象的な印象を与えるこの結果が得られます。 そして、組織、人々の行動、情報システムと顧客への対処方法について考えるとき、それは多くの場合非常に単純であり、それは私たちが渡そうとするアイデアや概念、文化的または行動的な特性ですツールと情報を活用して権限を付与します。

そして、私が25年以上にわたって持ってきたこのマントラであるすべてを支えています。つまり、あなたのスタッフが仕事をするのに必要なものを見つけることができない場合、それがツールであれ情報であれ、常に車輪を再発明します。 したがって、これは今ますます大きな課題になっています。多くの知識と多くの情報と物事が非常に迅速に動いており、人々が車輪を再発明するのを止めたいと思っています。 私のお気に入りの1つである人々の角度に戻って作業環境を考えると、キュービクルが良い結果をもたらす環境ではないことに驚いたとき、またはこの恐ろしいものを並べたとき、私は驚きましたここの写真は、あまり変わっていません。壁を下げて、作業スペースを開いたと呼びます。 しかし、真ん中に黄色のループがあり、知識を交換している2人の人がいます。 それでも、部屋の残りの部分を見ると、そこに座っているすべての人が忠実にそこにぶつかり、情報を画面に表示します。 そして、たいていの場合、実際に知識とデータを交換するわけではありません。それにはさまざまな理由があります。 しかし、黄色い円の左側の床の真ん中にあるインタラクションでは、2人の人がそこからチャットし、知識を交換し、おそらく何かを見つけようとして、「このレポートがどこにあるのか、それはおそらく機能していないので、彼らは何も持っていないので、床をさまよい、キュービクルのオフィススペースのルールを破って、それを直接やりました。

そして、私たちは冗談を言って冗談を言ってオフィスの周りに似たような環境を持っていますが、現実は非常に強力で効果的です。 そして、私のお気に入りの1つは、ウォータークーラーと呼ばれるモバイルまたは固定の分析プラットフォームです。人々はそこに着いて、周りでしゃべり、知識を交換し、ウォータークーラーに立ってアイデアを交換しながら、アイデアを比較し、分析を実行します。 それらについて考えるとき、それらは非常に強力な概念です。 そして、それらをシステムやツールに変換できれば、素晴らしい結果が得られます。 そして、私たちはこれまでもお気に入りでした。これは、本質的にオフィスの最も強力なデータ配信ハブであり、フロントデスクとも呼ばれています。 そして、あなたが何かを見つけることができないならば、あなたはどこに行きますか? さて、あなたはオフィスの前に歩いてレセプションに行き、「x、y、zがどこにあるか知っていますか?」と言います。仕事やある時点で彼らが何かを見つけられないとき。 そして、あなたは自問する必要があります、なぜ彼らはそうなのですか? イントラネットまたはツールなどのどこかにあるはずです。 見つけやすいはずです。

ですから、データと分析、および仕事をするためにスタッフに提供したツールと、人間が仕事とやり取りする方法に関しては、分析ツールとビッグデータプラットフォームが最近登場する前に、 、または「データ処理」とも呼ばれ、古い学校では、レポートと知識の共有は動的または共同またはオープンとはほど遠いものであり、人々が仕事をすることを期待するシステムのタイプについて考えると、古典的なものがありました人々は今、レガシーと呼んでいますが、現実は、それが乗っているのはレガシーだけであり、今日もまだここにあるということです。したがって、実際にはレガシーではありません。 しかし、従来のHRシステムとERPシステム–人事管理、エンタープライズリソースプランニング、エンタープライズデータ管理、および会社を運営するために情報を管理するために使用するシステム。 常にサイロ化されています。 そして、トップエンドから、部門イントラネットのようなシンプルなプラットフォームは、物事がどこにあるのか、どのようにそれらを取得するのか、場所の周りの知識とやり取りする方法を伝えようとします。 これをイントラネットに表示します。 それをそこに置くために時間と労力をかける人々と同じくらい良いだけです、さもなければ、それはただあなたの頭に残されます。 または、データがフードチェーンの最下部、企業のSAN、およびその間のすべてにあるため、ストレージエリアネットワークはファイルとデータでいっぱいですが、誰がそれを見つけるかを知っています。

たいていの場合、これらのクローズドデータプラットフォームまたはクローズドシステムを構築したため、人々はスプレッドシートやPowerPointのようなものに戻り、情報をその場所に渡しました。 しかし、最近私の中で心に浮かんだ面白いことがありました。それは、モバイルデバイスとインターネットが一般的に、物事が実際に良くなるという考えに作用するということでした。 そして、主に消費者空間で。 そして、日常生活でインターネットバンキングのようなものが増え始めたことは興味深いことです。 彼らとやり取りするために実際に銀行に行く必要はありませんでした。電話で行うことができました。 もともとそれは不格好でしたが、その後インターネットが広まり、ウェブサイトができました。 ご存知のように、最近実際に何回銀行に行ったことがありますか? 私は実際にはこれができません。先日このことについて会話しましたが、最後に銀行に行ったときのことを思い出せません。ショックを受けたので、これを思い出せなければならないと思いましたが、それはとても長かったです前に私は実際に私がそこに行ったときに覚えていないことができます。 そして今、私たちはこれらのガジェットをモバイルと電話、タブレットとラップトップの形で手にしています。ネットワークとツールとシステムへのアクセスがあり、物事がより良いものになることを学んだ消費者スペースがあります。消費者空間の急激な変化は、企業や環境内でより無気味で氷河的な変化をもたらしているため、その変化を日々の労働生活に常に取り入れているわけではありません。

また、データをハードコピーにライブストリームできないという事実に興味を持って楽しんでいます。 この画像には、実行された分析を見て座っている人がいます。また、おそらく統計学者またはアクチュアリーとして多額のお金を支払われている人によって作成された美しいグラフがあります。ハードコピーの分析と突っ込みます。 しかし、ここに私にとって恐ろしいことがあります。たとえば、この会議室のこれらの人々は、例としてこれを使用します。彼らは現在歴史的なデータと対話しています。 そして、それが作成されてから印刷されたときと同じくらい古いので、1週間前のレポートかもしれません。 現在、彼らはそれほど多くの悪いデータではなく、常に悪いデータである可能性のある古いデータについて意思決定を行っています。 彼らは今日、歴史的なものに基づいて決定を下していますが、これは本当に悪い場所です。 このハードコピーをタブレットや電話などに置き換えることができたのは、消費者スペースで非常に迅速に解決できたからです。そして今ではエンタープライズスペースで解決しました。リアルタイムは洞察力であり、リアルタイムの価値です。

そして、私たちはそれでどんどん良くなっています。 そして、ロビンが以前に提起したポイントに私を連れて行きます。それは市民データ科学者の概念であり、この概念の推進力でした。 私にとって、市民のデータサイエンティストは、iPadのようなものに関する適切なツールと情報を持っている普通の人々です。 彼らは数学をする必要はありません、彼らはアルゴリズムを知る必要はありません、彼らはアルゴリズムとルールデータを適用する方法を知る必要はありません、彼らはただインターフェースを使用する方法を知る必要があります。 そして、それが私の紹介と、iPadと雑誌、iPadと一緒に座っている幼児の概念に戻ります。 幼児は、iPadのインターフェイスを使用して情報に飛び込み、情報を操作する方法を非常に迅速かつ直感的に学習できます(ゲーム、ストリーミングメディア、ビデオなど)。 しかし、マガジンバーから同じ反応やインタラクションを得ることができず、ページごとにページをフラッシュするだけで、特にiPadで育った幼児の場合はあまり魅力的ではありません。 常に、私たちが提供するだけで、モバイルデバイス、特に十分な大きさの画面を備えたタブレットやスマートフォンなどのインターフェイスを提供する場合、特に対話することができる場合、人はツールや物を操作する方法を非常に迅速に見て学ぶことができます指の動きで触れてみると、市民データサイエンティストというこの概念が突然現れます。

適切なツールを使用してデータサイエンスを適用できるが、その方法を実際に知る必要がない人。 そして、私の考えでは、これの多くは、私が言ったように、需要と企業に移動し、変化した消費者の影響によって推進されました。 いくつかの非常に簡単な例。 私たちの多くは、小さな広告を入れたり、追跡や移動を確認したり、ブログやウェブサイトで何かを始めたり、Googleアナリティクスのようなツールを使用したり、ブログや小さなウェブサイトで目が覚めた、そこに少しのコードを入れることができ、Googleはウェブサイトに誰がいつ、どこで、どのようにアクセスしているかについてリアルタイムの洞察を与えてくれます。 そしてリアルタイムで、実際に人々がウェブサイトにアクセスし、ページを閲覧してから消えていくのを見ることができました。 そして、それは非常に驚くべきものでした。 リアルタイムアナリティクスを人々に説明しようとすると、GoogleアナリティクスがプラグインされたWebサイトを見せて、Webサイトにアクセスしている人々との実際のやり取りを実際に見て、ビジネスに対するこうした洞察をリアルタイムで得ました。」

小売業の例と、おそらく医薬品を考えてみましょう。アメリカのドラッグストアと呼んで、頭痛薬から日焼け止めクリームや帽子に至るまですべてを購入する薬局です。 リアルタイムの情報なしでその組織を運営しようとすることは、私たちが知っていることを知っている今では怖い概念です。 たとえば、足の交通量を測定したり、画面の片側にスマイリーの顔をしたデバイスを店の周りに置いたり、画面の右端に不幸な赤、中央にいくつかの異なる色合いを置くことができます。 また、最近では「ハッピーオアノット」と呼ばれるプラットフォームがあり、ショップに足を踏み入れると、実際の顧客感情のフィードバックに応じて、幸せそうな顔や悲しい顔を叩くことができます。 そして、それはリアルタイムでインタラクティブにすることができます。 ライブの需要主導型の価格設定を取得できます。 そこにたくさんの人がいる場合は、価格を少し上げて、在庫状況を確認して、たとえば人々に伝えることができます。たとえば、航空会社は、あなたがウェブサイトで何席空いているかを教えますフライトを予約しているときは、ランダムにダイヤルインするだけでなく、ターンアップしてフライトを取得できることを願っています。 ライブHRデータを使用すると、人々がクロックオンとクロックオフのタイミングを知ることができます。 調達の場合、調達中にライブデータがある場合は、1時間待って米ドルの価格をヘッジし、次の在庫を購入し、トラックを積み上げることができます。

人々にGoogle Analyticsを見せて、そのような逸話、このエウレカの瞬間、この「a-ha!」の瞬間を中継すると、この電球は「うーん、そうすることができる場所をたくさん見ることができます」 。 私がツールを持っていて、その知識にアクセスできたなら。」そして、私たちは今、ソーシャルメディアでこれを見ています。 朝食の写真を表示するだけでなく、賢いソーシャルメディアユーザーであれば、好きなものの数、トラフィックの量、友人の数を見る傾向があります。例えば、分析ツールとしてのTwitterが好きです。 Twitter.comにアクセスしてツールを使用できますが、Google Twitterアナリティクスのドットコムに入力するか、右上のボタンをクリックしてメニューをプルダウンして実行すると、これらの美しいライブグラフが表示されます。自分が行っているツイートと、それらとのやり取りの回数。 そして、あなたの個人的なソーシャルメディア上でのリアルタイム分析。 Googleアナリティクス、Facebook、LinkedIn、Twitterなどがあり、eBayの統計情報があなたの職場環境に届いていると想像してください。

今、私たちは指先でライブのウェブとモバイルを手に入れました。それはパワーの概念になります。 そしてそれが私の結論に私を導きます、そしてそれは常にツールとテクノロジーを早期に活用する組織が競争相手が実際に追いつかないかもしれない競争相手に対してそのような大きな利点を得るということを常に見つけたということです。 そして今、市民データ科学者の対立によってそれを見ています。 スキル、採用した知識、そして適切なツール、特にリアルタイムデータを表示してデータを発見し、キュービクルを歩き回らずにデータの場所を把握できる機能を備えた人を採用できれば質問を声に出して、人々と比較分析を行うためにウォータークーラーに行ったり、インデックスがどこにあるかレセプションに行ったりする必要があります。 彼らが指先でそれを行うことができ、彼らが彼らの会議にそれを持って行き、ハードコピーではなくリアルタイムで画面をめくって会議室に座ることができれば、突然、私たちは実際である必要のないスタッフに力を与えましたデータサイエンティスト。ただし、実際にデータサイエンスを使用し、組織の驚くべき成果を促進します。 そして、消費者が企業に駆り立てられた今、私たちが実際に通過したこの転換点、課題は、その企業をどのように提供するかであり、それが今日の議論のテーマだと思います。 そして、それを使って作品をまとめて、それを解決する方法をお聞きします。 デビッド、あなたに。

デビッド・スウィーナー:よろしくお願いします。たくさんの皆さん、ロビンに感謝します。 ロビン、あなたの元の評価に同意します。 分析プロセス、それは実際にソフトウェア開発と違いはありません。 組織内での課題は、実際のところ、物事がそれほど明確に定義されておらず、おそらく探索的な要素と創造的な要素があると思うのです。 Dez、あなたは知っています、あなたに同意します、車輪の再発明がたくさんあります、そして、あなたが知っている、あなたが今日に入る組織はありません、あなたは質問、まあ、なぜあなたはそれをこのようにしていますか? なぜビジネスはこのように運営されているのですか? また、質問するのは簡単です。また、組織内にいる多くの場合、変更することは困難です。 私は物事の類推、消費化が大好きです。 そのため、空港に行って座席を変更する必要がなくなったときは、携帯電話でそれを行います。 ブースのエージェントに行く必要はありません。そのエージェントがモノクロモニターで15分間入力して、座席の割り当てを変更するのを見る必要はありません。 私は自分の携帯電話でそれを行うことを好むので、興味深い発展です。

今日は、集合知について少しお話しします。 気付いていない人にとって、Statisticaは最先端の分析プラットフォームであり、30年以上にわたって存在しています。 アナリスト業界の出版物を見ると、最も直感的で使いやすい高度な分析ソフトウェアパッケージの1つとして常に注目されています。 そのため、ここ数年、集合知能と呼ばれる概念に取り組んできましたが、それを次のレベルに引き上げています。 この会話を始めたかったのは、あなたの組織でどのように仕事をするのですか?

そして、ここには2つの画像があります。 左側の画像は1960年代のイメージであり、1960年代にキャリアを始めたわけではありませんが、右側の画像は、私が働き始めた半導体工場です。 そして、私はその黒い建物で、左上の黒い屋上で働きました。 しかし、彼らは半導体製品を作りました。 これはGoogle Imagesの最近の写真です。 しかし、左側の1960年代の画像に戻ると、非常に興味深いです。 これらの人々は一列に並んでいて、集積回路や半導体を作っています。 しかし、標準化があり、物事を行う標準的な方法があり、明確に定義されたプロセスがありました。 おそらく、これらの人々はすべてオープンな環境に座っているため、何らかのコラボレーションが行われた可能性があります。 私たちは知識労働力の中でそれを少し失ったと思います。

左上にあるその建物に座ったとき、誰かと協力したいなら、それは開かれていませんでした。 これらのオフィスがあり、おそらくチームの一部は遠隔地にあったか、このキャンパスを横断しなければならなかったかもしれません。 徒歩25分で、建物の右端にいる誰かと話をする必要がありました。 途中で何かを失ったと思います。 それで、私は同じ考えを持っていた、なぜ人々はあなたの組織内で車輪を再発明し続けるのか? 1990年代と2000年代に、CRMとデータウェアハウジング、そしてある程度のBIで、組織全体が良い仕事をしたと思います。 何らかの理由で、分析が少し遅れています。 データウェアハウジング、データの標準化、正規化、およびこれらすべてとCRMに多大な投資が行われましたが、分析は何らかの理由で遅れをとっています。 そして、なぜだろうか。 創造性があるかもしれません。あなたのプロセスが明確に定義されていないか、物事を変えるためにあなたのビジネスであなたが変えようとしている決定やレバーを知らないかもしれません。 今日、組織に入ると、スプレッドシートで非常に手作業をしている人がたくさんいます。

そして、ご存知のとおり、私は今朝の統計を見て、スプレッドシートの80、90%にエラーがあり、これらのいくつかは非常に重要であると言ったと思います。 JPMorgan Chaseがスプレッドシートエラーにより数十億ドルを失ったWhaleのようなもの。 だから私は、物事を成し遂げるためのより良い方法が必要だと思う前提を持っています。 そして、前述したように、これらのデータサイエンティストがいます。 これらの人は高価であり、見つけるのは難しいです。 そして時々、彼らはちょっと変わったアヒルです。 しかし、データサイエンティストとは何かをまとめると、データを理解しているのはおそらく誰かだと思います。 数学を理解している人、問題を理解している人だと思います。 そして、本当に、結果を伝えることができる誰か。 また、データサイエンティストの場合、最近数年で給料が2倍になっている可能性があるため、最近は非常に幸運です。

しかし、多くの組織では、これらのデータサイエンティストはいませんが、組織には賢い人がいます。 組織があり、優秀な人が多く、スプレッドシートを使用しています。 統計と数学は主な仕事ではありませんが、データを使用してビジネスを推進します。 実際、私たちが取り組んでいる課題は、データサイエンティストまたは統計学者が1人または2人いることが幸運である場合、どのようにすればよいか、それらをどのように取り、それらの人々とのコラボレーションをどのように改善できるかです。組織内の他の個人ですか? 私たちの組織がどのように構成されているかを見てみると、私は始め、右から左に行きます。 そして、これは逆行であることは知っていますが、この種のビジネスユーザーがいます。

これがナレッジワーカーの大部分であり、これらの人々にとっては、基幹業務アプリケーションに分析を埋め込む必要があります。 おそらく、彼らはコールセンターの画面などに分析結果を表示しており、顧客に提供する次善の提案を伝えているのでしょう。 たぶん、それはウェブポータルの消費者または供給者であり、それは即座に彼らに信用などを与えます。 しかし、アイデアは、彼らが分析を消費しているということです。 真ん中に行くと、これらは知識労働者です。 これらは、今日のスプレッドシートで何かをしている人々ですが、スプレッドシートはエラーが発生しやすく、ある時点でガスを使い果たします。 これらの市民データ科学者は、我々が彼らと呼んでいるように、彼らのために私たちがやろうとしていることは、本当に自動化のレベルを高めることです。

また、分析では、作業の80〜90%がデータ準備の部分にあり、実際の数学ではなくデータ準備であると聞きます。 私たちはそれを自動化しようとしています。あなたがそうするかどうかにかかわらず、私たちはウィザードとテンプレートと再利用可能なものを持っています、そしてあなたは本当にあなたの環境内の基礎となるインフラストラクチャの知識を持っている必要はありません。 そして、左端を見ると、これらのデータサイエンティストがいます。 そして、私が述べたように、彼らは不足しています。 そして、彼らの生産性を高めるために私たちがやろうとしていることは、これらの市民データ科学者ができることを彼らができるようにすることです。 レゴブロックのようなものだと考えてください。そのため、これらのデータサイエンティストは、市民のデータサイエンティストが使用できる再利用可能な資産を作成できます。 一度構築すれば、車輪を再発明し続ける必要はありません。

そして、これらの人たちは、データベースで何かをすることができ、あなたの会社が行った既存の技術投資を活用できるかどうか心配するかもしれません。 ご存知のように、世界中のあらゆる場所でデータをシャッフルすることは、この時代には意味がありません。 ですから、私が述べたように、Statisticaを見ると、かなり長い間存在しているプラ​​ットフォームです。 そして、それは非常に革新的な製品です。 データブレンド、アクセスできないデータソースはありません。 私たちはあなたが期待するすべてのデータ発見と視覚化のものを持っています。 リアルタイムで実行できます。 そしておそらくそれは-ソフトウェアツール内に16, 000を超える分析関数があると思うので、これは私がこれまで使用したり理解したりできなかったよりも数学ですが、必要な場合はそこにあります。

ビジネスルールと分析ワークフローの両方を組み合わせて、実際にビジネス上の意思決定を下すことができます。 アルゴリズムを超え、ワークフローを示しますが、常に対処しなければならないビジネスルールがあります。 ガバナンスは非常に安全です。 FDAが私たちを信頼しているという点で、私たちは多くの製薬クライアントで使用されています。 ご承知のとおり、プリンに受け入れられるコントロールと監査機能があることをプリンで証明してください。 そして最後に、私たちはオープンで柔軟かつ拡張可能であるため、データサイエンティストの生産性を向上させ、市民のデータサイエンティストの生産性を向上させ、それを可能にするプラットフォームを作成する必要がありますこれらの分析出力を組織内のワーカーに展開します。

それを見てみると、ここにいくつかの視覚化の例があります。 ただし、分析出力を基幹業務ユーザーに配布できるため、左の最初の例はネットワーク分析図です。 そして、おそらくあなたは詐欺捜査官であり、これらの接続がどのように行われるのか分からず、これらは人である可能性があり、これらはエンティティである可能性があり、これらは契約である可能性があります。 しかし、あなたはこれをマウスで操作し、それと対話することで本当に理解することができます。もしあなたが詐欺捜査官なら、誰に話をすることができないので、調査する人の優先順位リストを理解します。優先順位を付けます。

予測メンテナンスダッシュボードの右側の画像を見ると、これは非常に興味深い問題です。 おそらくあなたは空港の所有者であり、そこにこれらのボディスキャナーがあります。 これらのボディスキャナーは、空港に行くと、約9か月の貯蔵寿命を持つコンポーネントがいくつかあります。 そして、これらは本当に高価です。 空港に複数のエントリポイント、複数のスキャナーがあり、ナンバー1になっている場合は、各ゲートに適切なスタッフが配置されていることを確認し、スキャナー内の部品についても注文したくない早く、私はそれが故障する前にそれらを持っていたいです。 おそらく空港を所有している場合、これらの事態がいつ解消されるかを予測し、人員配置レベルを予測することができます。

右下を見ると、これは製造環境にいる場合で、製造フローのグラフィカルな表現です。 少し見づらいですが、これらのさまざまなプロセスセクターには赤と緑の信号機があります。したがって、エンジニアの場合、非常に高度な数学がそこに行きますが、その特定のプロセスセクターを掘り下げて見ることができます。パラメータ、およびそれを入力すると、おそらく制御不能になります。 市民データ科学者に目を向けると、私たちの目標は、市民データ科学者が簡単にできるようにすることです。 ウィザードとテンプレートがありますが、本当に興味深いのは、この自動化されたデータヘルスチェックノードがあることです。 そして実際にこれが何をするか、組み込みのスマートを持っています。

データの準備について述べましたが、データの集約と準備の両方にかなりの時間がかかります。 しかし、データがあると仮定して、このデータヘルスチェックノードを介して実行でき、不変性、スパース性、外れ値、およびこれらすべてをチェックし、欠損値を埋め、多くの計算を行います理解できないので、デフォルトを受け入れるか、もう少し賢い場合は変更できます。 しかし、ポイントは、そのプロセスを自動化することです。 このことは、クレンジングされたデータセットに対して約15の異なるチェックと結果を実行します。 私たちがしているのは、人々がこれらのワークフローを簡単に作成できるようにすることです。

ここで、データサイエンティストと市民データサイエンティストのコラボレーションについて話します。 これらの画像を右側で見ると、このデータ準備のワークフローがわかります。 これは非常に洗練されているかもしれません。これはあなたの会社の秘密のソースかもしれませんが、組織内の誰かがこれらのデータサイロにアクセスできることは知っています。 1つ目は、それらをつかんでつなぎ合わせる方法、2つ目は、データヘルスチェックの範囲を超えた特別な処理が必要な場合があり、それがあなたの会社の秘密です。 組織内でこのワークフローを作成できますが、ノードとして折りたたまれます。 下向きの矢印が表示されますが、これは単なるノードであり、組織内にはこれらのアイテムが100個あります。 アイデアは、特定の空間について何かを知っている人々がいて、ワークフローを作成でき、他の誰かがそれを再利用できるということです。 車輪の再発明を最小限にしようとしています。

そして、分析モデリングワークフローでも同じことができます。 右側のこの場合、このワークフローには、おそらく15の異なるアルゴリズムがあり、タスクに最適なアルゴリズムを選択します。 そして、市民のデータ科学者として、クモの巣で何が起こっているかを理解する必要はありませんが、それはただノードに崩壊し、そのノードは単に「信用リスクスコアを計算する」と言います。何がありますか 「何かが不正な取引である確率を計算します。」市民データ科学者として、私は他の誰かが構築したこの非常に洗練された数学を使用できます。

データサイエンスの観点から、コードを書くのが好きなデータサイエンティストと話をしたことがあります。コードを書くのを嫌うデータサイエンティストと話をしました。 そしてそれは問題ないので、非常に視覚的でグラフィカルなユーザーインターフェイスがあります。 データを取得し、自動化されたデータヘルスチェックを行うことができます。おそらくコードを書きたいと思います。 私はPythonが好きで、Rが好きですが、アイデアは、これらのデータサイエンティストが不足していることで、特定の言語のコードが好きです。 コーディングしたい言語を特に優先しているわけではないので、Rを実行したい場合はRを実行してください。 Pythonを実行したい場合は、Pythonを実行します。 それは素晴らしいことです。 分析をAzureにバーストしたい場合は、分析をクラウドにバーストします。 したがって、ここでの目標は、データサイエンティストを可能な限り生産的にするための柔軟性とオプションを提供することです。

現在、データサイエンティストは非常に頭がいい人ですが、すべての専門家ではないかもしれません。また、できることにはギャップがあるかもしれません。 業界内を見ると、そこには多くの異なる分析市場が存在します。 これは一例であり、画像認識を行う必要があり、そのスキルを持っていない場合、Algorithsiaに行って画像認識アルゴリズムを取得する場合があります。 たぶん私はApervitaに行き、非常に特別なヘルスケアアルゴリズムを取得します。 Azure Machine Learning Libraryで何かを使用したいのかもしれません。 ネイティブのStatisticaプラットフォームで何かを使用したいのかもしれません。

繰り返しますが、ここでの考え方は、グローバルな分析コミュニティを活用することです。 4つの壁の中ですべてのスキルを習得するわけではないので、ソフトウェアを作成する方法(これが私たちの仕事です)により、データサイエンティストはさまざまな市場のアルゴリズムを使用できます。 私たちはRとPythonで長い間それをやってきたが、これはそこに存在するこれらのアプリ市場にそれを拡張している。 この上に表示されるのと同じように、SparkでH2Oを使用しているため、多くの分析アルゴリズムがあります。 これらをゼロから作成することに集中する必要はありません。オープンソースコミュニティに存在するこれらを再利用しましょう。これらの人々ができる限り生産的になることを望んでいます。

市民のデータサイエンティストとデータサイエンティストを獲得した後の次のステップは、これらのベストプラクティスをどのように促進し、配布するかです。 ソフトウェアには、分析をどこにでも配布できる技術があります。 そして、これはモデル管理の見方に近いものですが、タルサ、台湾、カリフォルニアの4つの壁や特定の設備に拘束されることはありません。 これはグローバルなプラットフォームであり、複数のサイトで使用されている多くの顧客がいます。

本当に重要なのは、台湾で何かをしていて、ブラジルでそれを複製したい場合、それは素晴らしいことです。 そこに行き、再利用可能なテンプレートを取得し、必要なワークフローを取得します。 これはそれらの標準と物事を行う一般的な方法を作成しようとしているので、私たちはどこでも完全に異なることをしているわけではありません。 そして、これのもう1つの重要な要素は、データが存在する場所に数学を持ち込みたいということです。 カリフォルニアとタルサ、台湾とブラジルの間でデータをシャッフルする必要はありません。 データに数学を取り入れることができるテクノロジーがあり、そのテーマに関する別のホットテクノロジーのウェブキャストがあります。

しかし、私たちはこのアーキテクチャを呼び出します。ここでは、ネイティブ分散分析アーキテクチャの概要を紹介します。 この背後にある重要なアイデアは、Statisticaというプラットフォームがあることです。分析ワークフローをアトムとしてエクスポートできます。 また、モデルまたはワークフロー全体を実行できますが、それは問題ではありません。 しかし、これを作成し、ターゲットプラットフォームに適した言語でエクスポートすることはできます。 これの左側では、多くの人がこれを行いますが、ソースシステムでスコアリングします。 結構です、スコアリングやデータベースでのモデル作成ができますので、興味深いです。

そして、右側にBoomiがあります。 これはコンパニオンテクノロジーであり、これらすべてと連携しています。 しかし、これらのワークフローを利用して、基本的に世界中のどこにでも転送することもできます。 IPアドレスを持つもの。 また、パブリッククラウドまたはプライベートクラウドにStatisticaをインストールする必要はありません。 JVMを実行できるものなら何でも、これらの分析ワークフロー、データ準備ワークフロー、またはこれらのターゲットプラットフォームのいずれかでモデルを実行できます。 パブリッククラウドでもプライベートクラウドでも、トラクター、車、自宅、電球、モノのインターネットなど、世界中のどこにでもワークフローを転送できるテクノロジーがあります。

確認してみましょう。 ご存じのように、基幹業務ユーザーがいるので、これらの人々は、彼らが使いやすい形式で出力を消費できるようにする技術を持っています。 市民データ科学者がいますが、私たちがやろうとしていることは、コラボレーションを改善し、チームの一員にすることですよね? そして、人々に車輪の再発明を止めてほしい。 これらのデータサイエンティストはスキルギャップがあるかもしれませんが、希望する言語でコーディングでき、分析市場に行き、そこでアルゴリズムを使用できます。 それで、これで、すべてがこれで素晴らしいと思うことができませんでしたか? これは完璧です、これが私たちがやっていることです。 再利用可能なワークフローを構築し、人々に指示を与え、レゴブロックを与えて、これらの強力な城や彼らがやりたいことを構築できるようにします。 まとめると、ビジネスユーザー、市民データサイエンティスト、プログラマーデータサイエンティストを強化するプラットフォームがあります。あらゆる種類のIoTエッジ分析のユースケースに対処でき、集合知のこの概念を実現しています。 それで、おそらく質問のためにそれを開くと思います。

ロビン・ブロア:わかりました。 私は最初に考えます-正直に言うと、私は以前にDell Statisticaからブリーフィングされたことを意味します、そして正直に言うと、あなたがプレゼンテーションで育てたことを知らなかったことに本当に驚いています。 そして、一つのことは、それが分析の採用において私にとってバグベアであったことであると言わなければなりません。それは、あなたが知っているように、ツールを手に入れることはそうではないということですか? そこには非常に多くのツールがあり、オープンソースのツールなどがあり、さまざまな、私が呼ぶもの、セミプラットフォームがあります。 しかし、あなたが持っている違いは、ワークフローのいくつかに特に感銘を受けたと思います。

しかし違いは、エンドツーエンドで提供しているように見えることです。 アナリティクスは、データの取得から始まり、データがいかに不安定であるかに応じて一連のステップ全体を実行する洗練されたビジネスプロセスのようであり、その後、データ。 そして、結果は何らかの形で現れ、それらは行動である必要があります。 私が目にした膨大な量の分析では、多くの素晴らしい仕事が行われましたが、それを実行に移すことはできません。 そして、あなたは必要なものが非常にたくさんあるようです。 どれほど包括的かはわかりませんが、予想以上に包括的です。 私はこれに非常に感銘を受けました。

スプレッドシートについてコメントをお願いします。 あなたはすでに何かを言っていますが、私が指摘し、長年にわたって指摘してきたことの1つですが、それはますます明白になっています、シャドウシステムであるスプレッドシートがたくさんあり、本当に思うスプレッドシートは、導入されたときは素晴らしいツールであり、さまざまな方法で素晴らしいものでしたが、一般化されたツールであり、実際には目的に合っていません。 確かに、BIコンテキストではあまり良くなく、分析コンテキストではひどいものだと思います。 Statisticaがフラッシュアウトしたり、スプレッドシートが過剰に使用されていたり、それについてコメントしたい場合の例について、コメントをお願いします。

David Sweenor:ええ、有名なスプレッドシートの間違いを調べることができると思います。 Googleまたは使用している検索エンジンは、多くの結果を返します。 スプレッドシートを置き換えることはないと思います。 それは私たちの意図ではありませんが、私が行く多くの組織には、これらのスプレッドシートウィザードや忍者、またはそれらを呼び出すものがいくつかありますが、これらは非常に洗練されたスプレッドシートを持っているので、人々は宝くじに勝ち、彼らは戻ってきませんか? そして、私たちがやろうとしていることは、スプレッドシートが存在することを知っているので、それらを取り込むことができますが、私たちがやろうとしているのは、ワークフローを視覚的に表現して、理解して他の人と共有できるようにすることです。 スプレッドシートは非常に難しく、共有するのは非常に困難です。 そして、スプレッドシートを私に渡すとすぐに、それを変更しましたが、今では同期が取れておらず、さまざまな回答が得られています。 私たちがやろうとしているのは、この周りにガードレールを配置し、物事をもう少し効率的にすることです。 また、スプレッドシートは複数のデータセットを組み合わせるのが本当にひどいですよね? 彼らはそこに落ちます。 しかし、それらを置き換えるつもりはありません。摂取します。そして、スプレッドシートを使用している人がやろうとしている「リスクを計算する」というノードがある場合は、シフトし始めています。 だからそれらはなくなった。

Robin Bloor:ええ、つまり、私が物事を見る視点の1つから、スプレッドシートは情報を作成するのに最適だと思います。 彼らは知識の島を作るのにも優れていますが、知識を共有するには本当に悪いです。 彼らはそれを行うためのメカニズムを一切持っておらず、スプレッドシートを誰かに渡すと、彼らが何をしているのかを正確に説明した記事のように読むことができるとは言えません。 ただそこにありません。 プレゼンテーションとStatisticaの機能について最も感銘を受けたのは、非常に不可知論的であると思います。 しかし、ワークフローのこのスレッドは実行されています。 データ取得から特定のBIアプリケーションへの埋め込み、さらにはアプリケーションの実行まで、エンドツーエンドのワークフローを見ることができると思いますか?

デビッド・スウィーナー:ええ、絶対です。 そして、エンドツーエンドの機能があり、一部の組織はそれを完全に使用します。最近は、すべての会社が1つのベンダーからすべてを購入するという幻想はありません。 ミックスがあります。 すべてにStatisticaを使用する人もいれば、モデリングワークフローに使用する人もいれば、データ準備ワークフローに使用する人もいます。 一部の人々は、それを使用して何百ものエンジニアリングレポートをエンジニアに配布しています。 そして、その間にすべてがあります。 そして、それは本当にエンドツーエンドであり、RまたはPython、Azure、Apervitaなどで使用したいアルゴリズムがある場合は、それらを使用するという点で、不可知論的なプラットフォームです。 それは素晴らしく、生産的であり、あなたが知っていることを使い、あなたが満足しているものを使います、そして私たちはそれらが制御され、監査可能であることを確認するメカニズムを持っています。

Robin Bloor:私は特にその側面が好きです。 私は、あなたがそこにあるものの富にあなたが言ったことを超えて話すことができるかどうか、私は知りません。 つまり、私はこれを見てきましたが、包括的な方法で見ていないし、私たちのライブラリには確かに膨大な量のPythonライブラリがありますが、その写真に追加できるものはありますか? 私はそれが非常に興味深いことだと思います、あなたは知っている、あなたがそれらを作成した様々な人々とあなたがダウンロードできるそれらを使用している様々な人々を知っていたので、あなたは信頼できるコンポーネントを持っているという考え。 あなたは、あなたがそれについてすでに言ったことを豊かにすることができますか?

David Sweenor:ええ、アプリ市場のいくつかは、あなたが知っているように、そこにあるアルゴリズム市場だと思います。 たとえば、アイオワ大学のジョン・クロムウェル博士は、手術中にリアルタイムで使用される予測モデルを開発しました。手術部位感染。 そして、そのスコアが十分に高い場合、彼らは手術室で直接介入します。 それはとても興味深いです。 それで、それほど大きくない別の病院があるかもしれません。 まあ、Apervitaは分析のための健康アプリ市場です。 これらのアプリマーケットプレイスの多くで1つを見つけて、それを見つけて再利用できます。トランザクションは、あなたとそれを所有する人との間で行われますが、1つを見つけて行くか、「ここにあります」誰もが専門家であり、すべてを知ることはできないため、グローバルコミュニティを活用していると思います。 RとPythonは一つのことだと思いますが、「この機能を実行し、これらのアプリ市場の1つに仕様を公開し、誰かに開発してもらいたい」という考えがあります。これは非常に興味深く、純粋にオープンソースモデルとは大きく異なります。

Robin Bloor:わかった 。 とにかく、ボールをDezに渡します。 デズに飛び込みたいですか?

Dez Blanchfield:もちろん 、ここで話していることの多くの要点を捉えていると思うので、ちょっとの間スプレッドシートのことを続けたいと思います。 そして、物理的な形式の古いスプレッドシートから電子形式への移行について、Robin氏はコメントしました。 おもしろいことに、スプレッドシートはもともと行と列のある紙のシートでしたが、手動で書き留めてから、力を入れて計算します。頭上または他のデバイスを使用してください。 しかし、手書きの間違いやディスレクシアでエラーが入り込む可能性がまだありますが、今ではタイプミスに置き換えました。 リスクは、スプレッドシートを使用するとリスクプロファイルがより速く、より大きくなることですが、Statisticaなどのツールはリスクピラミッドを反転させると思います。

私はよく、この絵を人間の棒人間のホワイトボードに1人で描き、次にそれらのコレクションを下に描きます。たとえば、そのホワイトボードの下部に10枚を想像して、ピラミッドは、ピラミッドのポイントが一人の人物にあり、ピラミッドの足が人々の集まりになっています。 そして、これを使用して、トップの1人がスプレッドシートを間違えて10人と共有した場合、エラーのコピーが10個あるという考えを視覚化します。 マクロに非常に注意し、それに移動する場合はVisual Basicに非常に注意してください。 なぜなら、スプレッドシートのような電子ツールを構築するとき、それは非常に強力ですが、良い面でも悪い面でも強力だからです。

Statisticaのようなツールは、そのリスクプロファイルを反転させる能力をもたらすと思います。つまり、個々の人が利用できる多くのツールを手に入れることができます。これらのツールとアルゴリズムを構築している人たちのチームがいる場合、ピラミッド、そして現在反転しているピラミッドのポイントが実際のツールである最下部までです。 また、データサイエンティストは、データの回帰分析の専門家である必要はありません。 彼らはツールを使用できるかもしれませんが、スプレッドシートの用語では、5人または6人の統計学者と、そのツール、そのモジュール、そのアルゴリズム、そのプラグインなどに取り組んでいる数理学者と数名の数学者がいる可能性があります。使用できる公開されたスプレッドシートはすべて、マクロをテストし、Visual Basicをテストし、アルゴリズムが機能することを確認した専門家によって実際に書かれたものだと想像してください。したがって、制御する方が優れていました。

多くの分析ツールがそうしていると思います。 私はそれのポイントに来ていると思います、あなたは今フィールドでそれを見ていますか、あなたは潜在的にエラーとミスとリスクを押し上げる可能性のあるスプレッドシートから、あなたがあなたと一緒に構築しているツールのポイントに移行していますプラットフォームは、データの発見がリアルタイムで正確であり、モジュールとアルゴリズムを構築している人々がそのリスクプロファイルを削除または削減していますか? カスタマーサービスはそれを本当の意味で見ているのですか、それともただ起こっているのに気づいていないのですか?

David Sweenor:ご存知のように、これに答える方法はいくつかあると思います。 しかし、私たちが目にしているのは、どの組織でもそうです。データウェアハウスとCRMで行ったような、企業投資の観点からは、分析が遅れていると思います。 しかし、私たちが見ているのは、組織を変え、その組織のinertia性を乗り越えるのに多くの時間がかかります。 しかし、私たちが見ているのは、スプレッドシートを取り、ワークフローを取っている人たちです。セキュリティとガバナンスについては、「まあ、おそらくスプレッドシートを持っている」、「まあ、これをロックダウンしてバージョン管理できます」と言いました。多くの組織が見受けられますが、たぶんそこから始めただけかもしれません。 そして、それが変更された場合、ワークフローがあり、私は最終的に行くことになりますが、誰がそれを変更しましたか? 彼らがそれを変えた理由。 彼らがそれを変えたとき。 また、ワークフローを設定して、この新しいスプレッドシートを1、2、3で検証および検証しない限り、本番環境に配置しないようにすることもできます。 人々は動き始めており、組織はそこで赤ん坊の一歩を踏み出し始めていると思いますが、おそらく私たちには長い道のりがあることをお勧めします。

Dez Blanchfield:確かに、セキュリティコントロールとガバナンスの両方を構築していることを考えると、ワークロードはそれとすべてを最高リスク責任者まで自動的にマッピングできます。 これらのツールやシステムへのアクセス方法と、誰がそれらを使用して何をするかを制御し始めることができるため、非常に強力です。 これに関連する他のことは、あなたが提供するツールの種類は、私が話している従来のスプレッドシートよりも人間の行動に向いているということです。同じダッシュボードと同じデータへのアクセスにより、実際に異なるビューを取得し、その結果、同じ情報からわずかに異なる洞察を得ることができます。 同じPowerPointで同じ会議に参加し、同じスプレッドシートを印刷し、すべて同じ固定データを使用するのではなく、より人間的な視点とビジネスおよび意思決定プロセスとの相互作用があります。

現在、ツールを取り上げている組織の行動と文化の変化を目にしますか?それは、部屋で同じスプレッドシートを見て、それをただ言葉で書き留めてメモをとる5人の人のようではありませんしかし、彼らは実際にリアルタイムでダッシュボードとツールと対話し、指先で視覚化と分析を行い、会議だけでなく組織全体の一般的なコラボレーションだけで、会話と対話のまったく異なるフローを取得していますか? 彼らは質問をし、本当の答えを得ることができるので、彼らはそれをリアルタイムで行うことができるからです。 それはあなたが今見ている傾向ですか、それともまだ起こっていませんか?

デビッド・スウィーナー:いいえ、それは間違いなくその道から始まったと思います。非常に興味深いことは、たとえば工場の例を挙げるとすればいいと思います。 その工場内で特定のプロセスセクターを所有し、特定の方法でこのデータを調べてやり取りしたい人がいるかもしれません。 そして、多分私は、すべてのプロセスを見下ろしているかもしれません。おそらくこれが一番下にあるのかもしれません。 私たちが見ているのは、一番の理由は、人々が組織内で共通のビジュアライゼーションまたは標準ビジュアライゼーションを使用し始めていると思いますが、それが彼らの役割に合わせて調整されていることです。それは、サプライチェーンの観点から見ている人とは非常に異なる見方であり、調整する必要があり、仕事を成し遂げるために必要なレンズを通して見なければならないので、素晴らしいと思います。

Dez Blanchfield:賢明で正確な意思決定を実際に行うために、意思決定プロセスは時間的にもスピードも低下していると思いますか? リアルタイム分析、リアルタイムダッシュボードを持っているなら、指先でStatisticaツールを持っているなら、床を横切って誰かに尋ねて何かについて尋ねる必要はありません。ハードコピーで。 コラボレーション、対話、実際の決定をその場で行い、その結果をすぐに得ることができます。 一部の企業はまだまだ把握していないと思いますが、そうすることで、このエウレカの瞬間になります。はい、私たちはキュービクルにとどまり、自宅で仕事をすることができます。私たちは共同で成果を即座に生み出します。 見て、あなたがこれまでに言わなければならないことを聞くことは素晴らしいと思います、そして、私はそれがどこに行くのかを本当に楽しみにしています。 また、Q&Aで多くの質問があることを知っているので、レベッカに戻ってそれらのいくつかを実行し、できるだけ早くそれらにアクセスできるようにします。 どうもありがとうございました。

Rebecca Jozwiak: Dezに感謝します。Daveには、聴衆から多くの質問があります。 そして、あなたの洞察にもデズとロビンに感謝します。 この特定の参加者は時間の早い時間に立ち寄らなければならなかったことを知っていますが、情報システム部門は、ツールを提供することに慣れているのではなく、洗練されたデータ管理を優先しているのでしょうか?知識労働者? つまり、そうです-先に進みます。

デビッド・スウィーナー:ええ、それは組織次第だと思います。 銀行、保険会社は、おそらくマーケティング組織とは異なる優先順位とやり方を持っていると思います。 私はあなたが見ている産業と機能だけに依存していると言わなければならないと思います。 産業ごとに焦点と重点が異なります。

Rebecca Jozwiak:わかりました、それは理にかなっています。 そして、別の出席者が知りたいと思った、Statisticaの背後にあるエンジンは何ですか? それはC ++ですか、それとも自分のものですか?

David Sweenor:まあ、これが30年前からあり、私の前に開発されたという点でそれを具体的に得ることができるかどうかはわかりませんが、実行するStatisticaアルゴリズムである分析アルゴリズムのコアライブラリがあります。 ここで、Rを実行できること、Pythonを実行できること、Azureにバーストできること、H2OでSparkを実行できることをここで見ました。そのため、さまざまなエンジンの観点からその質問に答える必要があると思います。 また、選択するアルゴリズムに応じて、Statisticaの場合はこのように実行され、H2OとSparkで選択した場合はそれが使用されるため、さまざまなものになります。

Rebecca Jozwiak:わかりました。 別の出席者は、このスライドを具体的に指して、どのような再利用可能なテンプレートを使用するかを市民データ科学者がどのように知っているのか、知りたいと尋ねました。 そして、そこからもっと広範な質問をするつもりです。 それは、基幹業務ユーザーまたはビジネスアナリストがこれらのツールを使用したいときに何を見ているか、彼らが簡単に手に入れて実行できるかどうかです。

David Sweenor:それに答えると思うし、もしあなたがWindowsに慣れているなら、これはWindowsベースのプラットフォームなので、これらのスクリーンショットの上部を切り取ったが、Windowsリボンがある。 しかし、彼らはどのワークフローを使用するかをどのように知っていますか? Windowsエクスプローラのように見えるため、ツリー構造があり、組織が設定したい場合でも、設定および設定できます。 ただし、これらのフォルダーがあり、これらのフォルダー内に再利用可能なテンプレートを配置することもできます。 そして、おそらくあなたの会社が採用できる命名法があると思います。たとえば、「リスクプロファイルの計算」、「これらのソースからデータを取得する」、そして好きな名前を付けます。 それはただの無料のフォルダで、ノートをキャンバスにドラッグするだけです。 とても簡単です。

Rebecca Jozwiak:わかりました。 次回のデモかもしれません。 その後、別の出席者が立ち上がって、それはあなたとロビンとデズが不正確さ、特にスプレッドシートについて話していたものですが、ゴミの出し入れは、それが来るとさらに重要であると考えています分析に。 ご存知のように、データの誤用は不幸な決定につながる可能性があります。 そして、彼はあなたがあなたの見解がよりフェイルセーフなアルゴリズムの開発に関して何であるか疑問に思っている、と私は推測する、彼は分析の「熱心な」使用という言葉を使う。 誰かが入って来て、本当に興奮し、高度な分析をしたい、高度なアルゴリズムを実行したい、しかし、彼らはよくわからないかもしれません。 それで、あなたはそれに対する一種の保護のために何をしますか?

デビッド・スウィーナー:ええ、だからできる限り答えるつもりですが、すべては人、プロセス、テクノロジーにかかっていると思います。 私たちは、人々を可能にし、組織内で実行したいプロセスを可能にする技術を持っています。 誰かにクーポンを送信する例では、それはそれほど重要ではないかもしれません。それがデジタルであるならば、それは本当に費用がかからないかもしれません、多分1レベルのセキュリティ管理があり、多分気にしません。 手術部位の感染を予測している場合、それについてもう少し注意したいかもしれません。 または、薬物の品質と安全性などを予測している場合は、もう少し注意したいかもしれません。 ご存知のとおり、ごみは出入りしているため、私たちがやろうとしているのは、組織が採用したいプロセスに合わせて調整できるプラットフォームを提供することです。

Rebecca Jozwiak:わかりました。 もう少し質問がありますが、1時間をかなり過ぎてしまったことを知っているので、プレゼンターに伝えたいだけです。 そして、Dell StatisticaのDave Sweenorに感謝します。 もちろん、Robin Bloor博士とDez Blanchfield氏は、今日のアナリストであることを感謝します。 来月、Dell Statisticaによる別のWebキャストを開催します。 デイブはこのトピックについてちょっとしたヒントを知っています。 もう1つの魅力的なトピックであるエッジでの分析についてであり、非常に魅力的なユースケースがそのWebキャストで議論されることを知っています。 あなたが今日見たものが好きなら、来月に戻って来てください。 それで、皆さん、別れを告げます。 本当にありがとう。 バイバイ。

あらゆる場所に分析を埋め込む:市民のデータ科学者を可能にする