Techopediaスタッフ、2016年9月22日
まとめ:ホストレベッカジョズウィアックは、ロビンブロア博士、デズブランフィールド、およびデルスタティスティカのショーンロジャースとエッジ分析について議論します。
あなたは現在ログインしていません。ビデオを見るにはログインまたはサインアップしてください。
Rebecca Jozwiak:ご列席の皆様 、こんにちは。2016年のHot Technologiesへようこそ。今日、「Edge Analytics:The IoT Economy at Last」があります。私の名前はRebecca Jozwiakです。 今日のウェブキャストのモデレーターになります。 Twitterの会話に参加する場合は、#HOTTECH16のハッシュタグでツイートします。
IoTは間違いなく今年の話題であり、モノのインターネットです。これは、マシンデータ、センサーデータ、ログデータ、デバイスデータに関するものです。 いずれも新しいものではなく、そのような種類のデータは永遠にありましたが、実際には使用できなかったため、そのデータを使用するための新しい方法がたくさん見られます。 特に、石油やガス、コモディティのある医療業界、金融市場では、これまで利用されていなかった豊富な情報にすぎません。 そして、多くの人がそれをうまくやる方法を本当によく理解しているわけではありません。 私たちはたくさんの小さなデータについて話していますが、それはたくさんのデータであり、ネットワークの問題、ハードウェアの関与、または処理の必要性があり、システムを詰まらせずにそれをどうやって行うのですか? それが今日のことです。
専門家のラインナップはこちらです。 The Bloor GroupのチーフアナリストであるDr. Robin Bloorがいます。 また、The Bloor GroupのデータサイエンティストであるDez Blanchfieldもいます。 また、Dell StatisticaのグローバルマーケティングおよびチャネルのディレクターであるShawn Rogersを迎えることができました。 それで、ボールをロビンに渡します。
ロビン・ブルーア博士:わかりました、ありがとうございます。 ボタンを押してスライドを投げます。 物事のインターネットのためにこの終末論的な絵を作成した理由がわかりません。 おそらく、最終的に混oticとなると思うからです。 まっすぐ進みます。 これは、あらゆるIoTプレゼンテーションのコースに匹敵します。 どういうわけか、それがどこに向かっているのかについてとんでもないことを言う必要があります。 実際、これのほとんどはおそらく真実です。 これらの曲線が徐々に拡大する様子を実際に見ると。 ご存知のように、パーソナルコンピューター、スマートフォン、タブレットは今後も増え続けるでしょう。 スマートテレビはおそらく上昇するでしょう。 ウェアラブルは、数年前と比べて、おそらく今爆発しています。 ほぼすべての車が徹底的に広く接続され、常にデータを徹底的に送信することは避けられない、接続された車。 その他すべて。 そして、BIインテリジェンスによるこの特定のグラフは、他のすべてが明白なものを非常に迅速に上回ることを示しています。
それでは、IoTについて何を言いますか? 最初のことは、アーキテクチャ上のポイントにすぎません。 データがあり、何らかの方法で処理しているときは、2つをまとめる必要があります。 そして、データが大量になり、さまざまな場所で収集されるようになったため、この2つはもはや自然と一緒ではなくなりました。 昔はメインフレーム時代にあったと思います。 したがって、処理層、トランスポート層、およびデータ層があるという点で考えることができます。 そして、何らかの形で、今日のトランスポート層は、処理を移動したり、ネットワーク間でデータを移動したりします。 選択肢は次のとおりです:データを処理に移動する、処理をデータに移動する、処理とデータを便利な実行ポイントに移動する、または処理を分割してデータを分割することができます。 また、モノのインターネットに関しては、データは出生時にほぼすでに断片化されており、実行する必要があるアプリケーションを実行できるようにするために、非常に多くの処理が断片化される可能性があります。
だから私は絵を描いた。 IoTについて興味深いのは、この図で集約ドメインについて説明し、サブドメインがあることを指摘することです。 したがって、ここのIoTドメイン1は何らかの車であり、ドメイン2とドメイン3とドメイン4は何らかの車であり、ローカルにデータを集約し、そのデータでローカルアプリを実行すると想像できます。さまざまなことを実行します。 しかし、すべての自動車に関する分析を行うには、必ずしもすべてのデータではなく、センターにデータを転送する必要がありますが、センターに集約する必要があります。 これについて考えると、同じIoTのセットに対して多くの異なる集約ドメインを持たせたい場合があります。 また、ドメイン自体がさらに集約される場合があります。 したがって、この繰り返しの階層を持つことができます。 基本的に、非常に複雑なネットワークです。 以前必要だったものよりもはるかに複雑です。
ここの一番下にメモがあります。 リーフノードを含むすべてのネットワークノードは、データ作成者、データストア、および処理ポイントになることができます。 そして、これにより、これまで見たことのないような配信の可能性が得られます。 Dezはそれについてもう少し詳しく説明するので、この特定のポイントに移ります。 物事のインターネットにアクセスし、すべてのデータが実際にイベントに解決されたら、このスライドのポイントは、イベントで標準化する必要があることを示すことだけです。 少なくとも、これが必要になります。 イベントが発生した時間、発生した地理的位置、それを作成したプロセスの仮想または論理的な場所、それを作成したソースデバイス、デバイスIDを取得して、どのソースデバイスがそれを作成したか、所有権を正確に把握しますデータとアクター、データを何らかの方法で使用する権利を持っている人々は、そのパーミッションをデータとともに持つ必要があります。つまり、実際にセキュリティを持たなければなりません。データ自体。 これを見ると、1秒ごとに何かの温度を報告するだけのセンサーを持っている場合でも、データの正確な場所を正確に特定するために、実際には非常に多くのデータがあることがわかります起源とそれが実際に何であるか。 ところで、これは完全なリストではありません。
したがって、将来のITランドスケープの観点から見ると、これは次のようなものです。それは単なるモノのインターネットではなく、イベント駆動型のアクティビティの世界にいるという事実もあります。イベント駆動型のアーキテクチャが必要になり、それらのアーキテクチャは大規模なネットワークに及ぶ必要があります。 もう1つはリアルタイムのすべてです。必ずしもリアルタイムである必要はありませんが、ビジネスタイムと呼ばれるものがあります。ビジネスタイムとは、実際にデータを提供して準備する必要がある時間です。処理されます。 それは、作成後1ミリ秒ではないかもしれません。 しかし、すべてのデータには常にそのような時間があり、イベント駆動型アーキテクチャを構築すると、世界の仕組みに対するリアルタイムのアプローチの観点から考えるのが賢明になり始めます。
つまり、実際に私たちが話しているのはIoTの分析です。 それにも関わらず、それはまだ洞察への時間であり、洞察への時間ではなく、洞察の後に行動が必要です。 したがって、洞察を得るまでの時間と行動を起こすまでの時間は、私がそれを要約するものです。 そうは言っても、私はボールをデズに戻します。
Dez Blanchfield:ありがとう、ロビン。 いつものように洞察力。 すべてのインスタンスをフォローするのは難しい行為であるという事実が大好きですが、ベストを尽くします。
私が見ているものの1つであり、正直に言うと、不愉快で否定的な形ではなく、しばしばそれによって楽しまれていますが、世界を引き継ぐもののインターネットについて多くの懸念とパニックがありますスロットに入れるとデータが失われ始めるので、過去20年から30年の間にインターネットに近いファクシミリであったことを少し振り返ってみたいと思います。物事の、しかし、多分まったく同じ規模ではありません。 そして、私たちが実際にここにいて、このレベルのスケールではなく、この速度でもないいくつかの問題を解決したことを示すためです。 というのは、実際に問題を解決でき、答えの一部がわかっているからです。 私たちは、以前の学習の一部を探して、適用し直さなければなりません。 これがこれからの会話全体であり、Q&Aセクションでおしゃべりするだけの楽しいことはたくさんあります。
しかし、サークル内のモノのインターネットについて考えると、非常に初期に書かれた設計レベルでの集中化が現在非常に多くあります。 たとえば、Fitbitデバイスはすべて1つの中央の場所に移動する傾向があり、どこかのクラウドプラットフォームでホストされる可能性が高く、これらすべてのデバイスからのすべてのデータは同じようになります。たとえば、Webを含むスタックのフロントエンドアプリおよびデータベースのサービス。 しかし、時間の経過とともに、その規模では、到着するデータの量に対処するためにリエンジニアリングが必要になり、複数の場所と領域に複数のフロントエンドとスタックの複数のコピーがあるようにリエンジニアリングします。 そして、私たちはこれを見ています。そして、私たちが議論できるいくつかの例を紹介します。
これの重要な点は、私がカバーしようとしているこれらのソリューションのいくつかを見てきましたが、物事のインターネットが生成するデータとネットワークトラフィックの規模と量は、中央からの移行を緊急に必要とすることです私の考えでは分散アーキテクチャに対応しており、これはわかっていますが、ソリューションが何であるかを必ずしも把握していません。 モノのインターネットとは何かという概念を考えると、それは大規模なネットワークモデルです。 今や騒がれているのはたくさんあります。 最近まで騒がなかったもの。 実際、昨日、スタックについて冗談を言って話していたと思いますが、新しいトースターを買いに行き、クリーニングが必要なときなど、さまざまなことを教えてくれるオプションが付いてきました。 そして、非常によく似た機能を備えた新しい電子レンジで、実際に携帯電話のアプリにpingを実行して、私が再加熱していたことが完了したと言うこともできます。 そして、私が話したくないことがいくつかある場合、それは私の冷蔵庫、電子レンジ、トースターだと非常に意見があります。 私は彼らが愚かなデバイスであることにかなり快適です。 しかし、最近新しい車、小さなアウディを手に入れました。それは私に話をしてくれます。それについて非常に満足しています。 地図をリアルタイムで更新して、送信されたデータを使用してさまざまなメカニズムでトラフィックを検出したため、ポイントAからポイントBへのより良いルートがある場所を教えてくれます。
このスライドがあります。 大量のネットワークモデルでは、データ処理および分析モデルの中央から分散型のキャプチャおよび配信への移行が必要であることがすでにわかっています。 右端にある3つの小さなグラフ図から動きが見られます。3つのうちの左にあるものは、すべての小さなデバイスが中央の場所に来る中央集中型モデルです。データを収集しますが、規模はそれほど大きくありません。彼らはそこでうまく対処します。 中間には、もう少し分散型のモデルとハブアンドスポークがあります。これは、次世代のモノのインターネットで必要になると思います。 そして、右側には、この完全に分散されたメッシュネットワークがあります。これは、物事のインターネットとマシンツーマシンが将来非常に短期間で移動する場所ですが、さまざまな理由があります。 そして主な理由は、これまでほとんどの通信にインターネットプラットフォームを使用しており、実際にこのデータの多くを運ぶための2番目のネットワークを構築していないためです。
Batelcoネットワークなど、すでに存在する2番目のネットワークがあります。 多くの人は、通信のネットワークがインターネットではないという事実を考えません。 インターネットは多くの点で非常に別のものです。 彼らはスマートフォンから電話ネットワークを介してデータをルーティングし、その後電話ネットワークを介してインターネットに一般的にルーティングし、そこで実際にそれらを2つのネットワークに階層化します。 しかし、それは完全に可能であり、物事のインターネットには別のネットワークが必要になる可能性があります。 一般に産業用インターネットについてはトピックとして説明しますが、ここでは詳しく説明しませんが、本質的には、データの輸送の種類またはモノのインターネットおよびマシンツーマシン用に特別に設計された別のネットワークについて説明していますコミュニケーション。
しかし、大量のネットワークと分散データが非常にうまく機能するのを見た場所を共有したい例のいくつかは、インターネットのようなものです。 インターネットは、核戦争を生き抜くことができるように、初日から特別に設計および設計されました。 米国の一部が爆破された場合、インターネットは、接続されている理由によりパケット損失なしでデータがインターネット上を移動できるように設計されています。 そして、それは今日でも世界規模で存在しています。 インターネットには、冗長性とルーティングパケットに関する複数の機能があります。 実際、BGP、Border Gateway Protocol、およびBorder Gateway Protocolと呼ばれるものによって制御されるインターネットは、ルーターまたはスイッチ、またはサーバーのダウンに対処するように特別に設計されています。 電子メールを送信または受信するときに、3つの電子メールを連続して送信した場合、それらの各電子メールが同じ最終目的地への同じルートをたどるという保証はありません。 さまざまな理由で、インターネットのさまざまな部分を移動する場合があります。 停電が発生する可能性があり、アップグレードするためにオフラインになるメンテナンスウィンドウが存在する可能性があり、ネットワークに輻輳が発生する可能性があります。車や公共交通機関や船や飛行機のある交通ネットワークのようなものではそれがわかります。 毎日、コンテンツ配信ネットワークを介して、ブラウザなどを介してラップトップ、タブレット、コンピューターなどのデバイスにコンテンツを取得します。 コンテンツ配信ネットワークとは、Webサーバーなどのプライマリサービングプラットフォームからコンテンツのコピーを取得し、そのコピーとキャッシュのコピーをネットワークのエッジに少量移動し、エッジの最も近い部分からのみ配信することです。
スパム対策とサイバーセキュリティ-スパムイベントがカナダで発生し、Microsoftがそれを検出し、ランダムな人々のグループに送信されている同じ電子メールのコピーが多数ある場合、チェックサムが取られ、そのメッセージの署名が作成してネットワークに入れ、すぐに配布します。 そのため、電子メールが受信トレイに届くことはありません。また、届くと、ネットワークの端のどこかで検出されたため、すぐにスパムとしてタグ付けされます。 そのため、ネットワークのエッジの他の部分にはこのスパムメッセージの署名が通知され、データベースのインデックスに登録されます。これらのメッセージが地球の反対側に表示され始めたら、それらを検出し、スパムであることがわかります。 そして、同じことがサイバーセキュリティにも当てはまります。 惑星の片側で発生しているハックが検出され、登録およびマッピングされます。ネットワークの他の部分で突然すべてを処理し、ルールとポリシーを提出して、ブロックできるかどうかを確認します。 特に、DoSや分散型DoSなどの新しい影響により、中央のWebサイトを攻撃するために何千ものマシンが使用されます。
ビットコインとブロックチェーンはデフォルトで、その性質上、分散型台帳、ブロックチェーンであり、ネットワークのあらゆる停止または破損に対処します。 詐欺の検出と防止、電力と水道施設–電力ネットワークを知っています。ネットワークの一部に木が着地し、ポールと電線を取り除いても、私の家には電力が供給されています。 私はそれについてさえ知りません、私はしばしばニュースでそれを見さえしません。 そして、もともと「すべての道路はローマに通じていた」という中央集権的なモデルがあったトランスポートネットワークに慣れていて、最終的にはハブとスポークを備えた分散型のモデルに行く必要がありました。さまざまなメッシュルートとさまざまな交差点を介して、都市の片側から他の側に到達できるメッシュネットワークに接続します。 したがって、ここで私たちが目にしているのは、モノのインターネットで今やっていることのこの集中モデルがネットワークの端に押し出さなければならないということです。 そして、これはこれまで以上に分析に当てはまります。つまり、分析をネットワークにプッシュする必要があるということです。 そして、それを行うには、私の考えでは、そのデータとデータのストリームにアクセスして処理する方法にまったく新しいアプローチが必要です。 インターネットに接続されたデバイスでは、限られたインテリジェンスがネットワークの端に押し出されていると思われるシナリオについて話しますが、すぐにそれらのデバイスのインテリジェンスが増加し、必要な分析のレベルが増加することを確認しますする。 そして、その結果として、ネットワークを通じてこれらのスマートをさらにプッシュする必要があります。
たとえば、スマートアプリとソーシャルメディア-ソーシャルメディアと一部のスマートアプリについて考えると、それらは依然として非常に重要です。 Facebookのようなユーザー向けのデータセンターは2つまたは3つしかありません。 Googleはさらに分散化されましたが、世界中にはまだ限られた数のデータセンターしかありません。 次に、コンテンツのパーソナライズについて考えるときは、非常にローカルなレベルで考える必要があります。 その多くは、ブラウザまたはローカルコンテンツ配信ネットワークレイヤーで行われています。 そして、健康とフィットネスのトラッカーについて考えます-それらから収集されている多くのデータはローカルで分析されているので、手首に付けたGarminとFitbitデバイスの新しいバージョンは、デバイスでよりスマートになりつつあります。 現在では、分析を完了させるために、心拍数に関するすべてのデータを中央サーバーに送信しません。 彼らはそのインテリジェンスをデバイスに直接組み込んでいます。 車内ナビゲーションでは、車は常に中央の場所から更新とマップを取得していましたが、現在はスマートが車内にあり、車が自動的に意思決定を行い、最終的に車がメッシュになります。 車は、次世代の3Gまたは4Gワイヤレスネットワークを介した何らかの形式のワイヤレスネットワークを介して互いに通信しますが、最終的にはデバイス間のデバイスになります。 そして、その量に対処する唯一の方法は、デバイスをよりスマートにすることです。
すでにローカルで情報を収集し、それを中央またはメッシュネットワークに送信し、ローカルで何が起こっているかを判断する緊急警告システムがあります。 たとえば、日本では、スマートフォンで加速度計を使用してスマートフォンで実行するアプリケーションがあります。 スマートフォンの加速度計は、振動と動きを検出し、通常の日常の動きと地震の震えと衝撃の違いを判断できます。 そして、その電話はすぐに、ローカルであなたに警告し始めます。 実際のアプリは、地震を検出することを知っています。 ただし、分散ハブアンドスポークモデルのネットワークを介してそのデータを共有しているため、データがネットワークを流れるとすぐに、またはできるだけ早く警告されます。 そして最終的に、中央の場所または中央の場所の分散コピーに到達すると、すぐ近くにいない人々に押し戻され、惑星の動きを検出していないが、警告する必要がある津波が来るかもしれません。
そして、スマートインフラストラクチャ–インテリジェントインフラストラクチャの概念である私たちは、すでにスマートビルディングとスマートインフラストラクチャに知性を組み込んでいます。 実際、昨日、私は車を都市の一部が改装され再建されている新しいエリアに駐車しました。 そして、彼らはすべての道路をやり直し、道路にセンサーがあり、実際の駐車メーターは、私が車で運転したとき、それが2時間の制限のためにリフレッシュするときに知っていることを知っています車は動いておらず、実際に補充してさらに2時間滞在することはできません。 私は車に乗って、スペースから出て、さらに2時間そこに留まることができるようにそれをtrickすために引き戻さなければなりませんでした。 しかし、興味深いのは、最終的には、ローカライズされたセンサーとしてエリアに入ってくる車を検出するだけでなく、ナンバープレートを見るカメラで認識が適用される光学特性のようなものになります私は実際に引き出して引き戻し、それをだまして、それが私を更新させないので、先に進みます。 そして、それはそのデータを配布し、私がそれを他のどこでもできないことを確認し、継続的にネットワークをだます。 本来、よりスマートにならなければならないからです。さもなければ、私たちはみなそれをだまし続けます。
80年代後半から90年代初期のファイアウォールテクノロジーのどこにCheck Point FireWall-1と呼ばれる製品を実際に個人的に住んでいたかという例があります。 ルールを作成し、特定の事柄に関するポリシーとルールを構築するために使用した非常にシンプルなファイアウォールテクノロジーは、特定のポートとIPアドレスおよびネットワークを経由するトラフィックのタイプ、ある場所から別の場所へのWebトラフィック、ブラウザとクライアント側からサーバー側に移動します。 この問題を解決するには、実際にファイアウォール自体からロジックを取り出し、実際にASIC(アプリケーション固有の集積回路)に移動します。 イーサネットスイッチのポートを制御していました。 ファイアウォールとして決定するために実際にサーバーとして使用していたサーバーコンピューターは、パケット検査のたびに通過するトラフィックの量を処理するのに十分なほど強力ではないことがわかりました。 パケットインスペクションとインターネット検出に必要なロジックを、ネットワークレベルを通過する大量のデータを処理できるネットワークスイッチに移動することで、問題を解決しました。 ファイアウォールを使用して集中レベルでそれを心配することなく、スイッチに移動しました。
そのため、メーカーに、パスとルールとポリシーをイーサネットスイッチにプッシュする機能を構築させて、実際のイーサネットポートレベルで、そしておそらくプールの多くの人々がこれに精通していないようにしました。すべてが現在はワイヤレスの世界に住んでいますが、昔々、すべてをイーサネット経由で接続する必要がありました。 イーサネットポートレベルでは、パケットの検査を行って、パケットがスイッチやネットワークに移動することさえ許可されているかどうかを確認していました。 これのいくつかは、特にIRTデバイスからネットワーク内のデータをキャプチャし、それを検査して分析し、おそらく分析することで意思決定を行うというこの課題について、現在解決しているものです。 また、ビジネスインテリジェンスの洞察と、デバイスがデバイスと通信して意思決定を行うマシンツーマシンレベルのものについて、人間がより良い意思決定を行う方法やその他の分析とパフォーマンスに関する情報を得ることができます。
そして、これは近い将来に解決を検討しなければならない傾向になります。そうしないと、ノイズの大洪水になってしまうからです。 ビッグデータの世界で見たように、データレイクのようなものがデータの沼地になり、一元化された処理分析をどのように解決するかを理解していないノイズの大洪水になりますファッション。 私の考えでは、この問題をIoTですぐに解決せず、プラットフォームソリューションを非常に迅速に入手できなければ、非常に非常に悪い場所になってしまいます。
そしてそれを念頭に置いて、私は私のポイントで締めくくりたいと思います。つまり、ビッグデータと分析の分野で現在起こっている最大の変化の1つは、インターネットの影響に即座に反応する必要性によって推進されていると信じている大量かつリアルタイムの分析に関するもので、分析をネットワークに移動し、最終的には処理するためだけにネットワークのエッジに移動する必要があります。 そして、最終的には、ネットワークとネットワークのエッジに、インテリジェンスをハブアンドスポークモデルに入れて、実際に管理し、リアルタイムで洞察を得て、そこから価値を得ることができるようになります。 それで、ゲストに引き継いで、この会話が私たちをどこへ連れて行くのかを見ていきます。
ショーン・ロジャース:ありがとうございます。 これは、Dell StatisticaのShawn Rogersであり、少年は、そもそも、ここで触れたすべての主要なトピックに完全に同意します。 そして、レベッカ、あなたは、このデータは新しいものではないという考えから始めました。データ、データ、IoTのデータについて議論するのにどれだけの時間とエネルギーが費やされているかは、私にとって驚くべきことです。 確かに重要なのは、あなたが本当に簡単なことをしていて、サーモスタットを1秒に1回タップしている場合でも、ロビンは良い点を指摘しました。 、あなたは知っている、いくつかの興味深いデータの課題。 しかし、最終的には、そして業界の多くの人々がこの方法でデータについて話していると思います-それは本当にそれほど興味深いものではなく、レベッカのポイントに、それは良い、長い時間の周りでしたが、過去にそれを最大限に活用することはできませんでした。 そして、高度な分析業界と一般的なBI業界は、IoTに真剣に向き始めていると思います。 そして、デズ、あなたの最後のポイントまで、これは私が思うビッグデータ環境の一部または挑戦的なポイントの1つであると非常に真実です。 このタイプのデータを使用してできることについては誰もが非常に興奮していると思いますが、同時に、洞察を適用し、行動を起こし、データがどこにあるかを分析する方法を理解できない場合は、私たちは、人々が本当に自分の道を進んでいるとは思えない課題を抱えています。
そうは言っても、高度な分析の分野では、特に分析を適用する場合、IoTデータで何が起こると思うかを大ファンにしています。 このスライドにはたくさんの情報がありますので、皆に狩りを始めさせましょう。しかし、小売業のようなさまざまな分野を一番右に見てみると、より革新的であるか、コスト削減やプロセスの最適化や改善は非常に重要であり、そのための多くのユースケースが見られます。 スライドを左から右に見ていくと、これらの個々の産業がIoTに分析を適用するときに、それぞれの業界が新しい機能と差別化の機会をどのように主張しているのかがわかります。 結論としては、私たちが議論しているように、データやアーキテクチャについて心配するだけでなく、その方法を検討する必要があることも考えなければなりません。分析をそれに適用し、分析を行う必要がある場所。
今日の電話で私たちの多くにとって、ロビンと私はお互いを非常に長い間知っており、過去の伝統的なアーキテクチャ、集中型データベースやエンタープライズデータウェアハウスなどに関する多くの会話をしてきました。私たちは過去10年ほどにわたって、これらのインフラストラクチャの限界を広げるという非常に良い仕事をしています。 そして、私たちが情報に適用している素晴らしい分析のすべてをサポートするために、そしてもちろん、情報がアーキテクチャを破壊していることをサポートするために、私たちが今日に望んでいるほど安定したものでも強いものでもありません。データの速度、データの量などは、この種の作業に対する従来のアプローチと戦略のいくつかの制限を確実に引き伸ばしています。 ですから、企業がこれについてより機敏で柔軟な視点をとる必要性を呼び始めていると思うのですが、それがIoT側について少し話したいと思います。
私がやる前に、ちょっと待って、みんなに電話をして、Statisticaが何で、何をするのかについて少し背景を説明します。 このスライドのタイトルでわかるように、StatisticaはIoTプラットフォームの予測分析、ビッグデータ、視覚化です。 製品自体は30年を少し超えており、予測分析や高度な分析をデータに適用できるというラインに沿って、おそらく皆さんが精通している市場の他のリーダーと競争しています。 私たちは分析を行う場所の範囲を広げる機会を見つけ、少し前にDezとRobinの両方が今日話していることを活用するために私たちをかなりうまく位置づけているいくつかのテクノロジーに取り組み始めました。アナリティクスを配置する場所と、それをデータと融合する方法。 その側面に沿って、プラットフォームで対処しなければならない他のことがあります。そして、私が言ったように、Statisticaは長い間市場に出ていました。 データブレンドの面では非常に優れているため、今日のデータアクセスについてはあまり話していませんが、これらの多様なネットワークにアクセスして、適切なデータを手に入れることができます。適切なタイミングは、エンドユーザーにとってますます興味深く、重要になっています。
最後に、ここでもう1つコメントします。Dezはネットワーク自体について良い点を指摘し、環境全体の分析モデルに対してある程度の制御とセキュリティを持ち、データへの接続が非常に重要になっているためです。 数年前にこの業界に参入したとき(現時点では20近いと思います)、高度な分析について話したとき、非常に精巧な方法でした。 組織内の数人の人だけがそれを手に入れ、それを展開し、必要に応じて人々に答えを与え、必要に応じて洞察を提供しました。 それは本当に変わりつつあり、データにアクセスし、データにセキュリティとガバナンスを適用し、その上で共同作業を行うための1つ以上の多様で柔軟な方法で作業していた多くの人々です。 これらは、Dell Statisticaが検討している重要なものの一部です。
しかし、今日のタイトルに少し近いトピック、つまり、物事のインターネットから得られるデータに対処する方法と、さまざまなソリューションを検討しているときに何を探したいのかについて詳しく説明します。 私が今あなたの前で起きたスライドは一種の伝統的な見方であり、DezとRobinの両方がこれに触れました。センサー、それが自動車であろうとトースターであろうと、 Dezが言及したように、風力タービン、またはあなたが持っているものを、データソースからネットワークを介して中央集中型の構成に戻します。 そして、それは非常にうまくネットワーク化し、多くの企業がもともとそのモデルでそれをやり始めているIoTスペースに参入します。
スライドの一番下を見ると、他の伝統的なデータソースを取得し、IoTデータを補強してから、この種のコアで、コアがデータセンターであるかどうかを考えますクラウドにあるかもしれませんが、それは実際には重要ではありません。Statisticaのような製品を使用し、その時点で分析を適用し、その洞察を消費者に提供します。 そして、これは現時点でのテーブルステークスだと思います。 これはあなたができることであり、高度な分析プラットフォームに十分なオープンアーキテクチャを持ち、これらすべての種類の多様なデータソース、これらすべてのセンサー、これらすべてのさまざまな宛先と対話する必要があります。データがあります。 そして、これはあなたができるべきことだと思うし、市場の多くのリーダーがこのようなことをすることができるということは本当だと思うと思う。 ここStatisticaでは、コア分析としてこれについて話します。 データを取得し、データをコアに戻し、処理し、必要に応じて、または有利な場合はさらにデータを追加し、分析を行い、その情報をアクションまたは洞察のために共有します。
そして、私はそれらが機能の観点から確かであることを思う、私たちはおそらく、あなたが知っている、これが必要であり、誰もがこれを行う必要があることに同意するでしょう。 私が言ったように、IoTセンサーなどの多様なデータソースから来る膨大な量のデータがある場所は、車やセキュリティカメラ、製造プロセスのいずれであっても、興味深いものになり始めますデータが実際に生成されている場所で分析を行うことができるという利点。 そして、ほとんどの人にとっての利点は、分析をコアからエッジに移行し始めるときに、発生しているデータの課題の一部を拡散するこの機能であり、DezとRobinはおそらくこれについて最後にコメントするでしょう今日は、エッジでデータを監視し、アクションを実行できるようにする必要があると思います。そのため、すべてのデータをネットワーク全体に移動する必要は必ずしもありません。 ロビンはこのことについて、彼が作成した建築写真で話しました。そこでは、これらのさまざまなソースがすべてありますが、通常、いくつかの集約ポイントがあります。 よく見られる集約ポイントは、センサーレベルにありますが、ゲートウェイレベルにあることもあります。 そして、これらのゲートウェイは、コアに戻る前のデータソースからのデータフローの一種の仲介者として存在します。
Dell Statisticaが活用した機会の1つは、集中型の高度な分析プラットフォームからモデルをエクスポートして、モデルを取得し、ゲートウェイや内部などの別のプラットフォームでエッジでそのモデルを実行できることです。データベースの、またはあなたが持っているもの。 そして、それが私たちに与える柔軟性は、今日の会話の本当に興味深い点であると思います。今日のインフラストラクチャにそれがありますか? アナリティクスをデータが存在する場所に常に移動するのではなく、アナリティクスをデータが存在する場所に移動することができますか? そして、それはStatisticaがかなり長い間注目してきたことであり、スライドをよく見ると、姉妹会社であるDell Boomiから他の技術がいくつかあることがわかります。 Dell Boomiはクラウドのデータ統合およびアプリケーション統合プラットフォームであり、Dell Boomiを人身売買デバイスとして実際に利用して、Dell StatisticaからBoomiを経由してエッジデバイスにモデルを移動します。 そして、これは企業が要求するアジャイルなアプローチだと思います。1分前に示したバージョンが気に入っている限り、センサーからデータを最後まで移動するという中核的な考え方です。センターは、同時に企業が私がここで概要を述べているような方法でそれを実行できるようにしたいと考えています。 そして、これを行うことの利点は、ロビンとデズの両方がしたいくつかのポイントにあります。つまり、あなたはあなたのビジネスのスピードで決定を下し、行動を起こすことができますか? アナリティクスをある場所から別の場所に移動し、そのエッジデータをコアに常に戻すという時間、お金、エネルギー、および複雑さを省くことができますか。
エッジデータの一部は、そのデータを保存し、それを保持してネットワークに戻すことが理にかなっている場合、常に十分に高いメリットがあると最初に言いますが、どのようなエッジ分析によりデータが実際に到達する速度で意思決定を行う能力はありますか? 可能な限り最高の価値が得られる速度で洞察とアクションを適用できること。 そして、高度な分析とIoTデータの活用に関して、私たち全員が求めているのは、ビジネスの速度または顧客が要求する速度で動くこの機会だと思います。 私たちの立場は、あなたが両方をできるようにする必要があると思います。 そして、より多くの企業がより多様なデータセット、特にIoT側からのデータセットを検討するにつれて、すぐにそして非常に迅速に、彼らはベンダー空間を検討し始め、Statisticaの能力を要求し始めると思います。 これは、従来から長年行ってきたように、モデルをコアに展開するか、IoTゲートウェイのような非伝統的なプラットフォームに展開し、実際にデータを分析してデータに適用できるようにすることですデータの生成時にエッジで。 そして、それがこの会話のエキサイティングな部分の出番だと思います。データがセンサーから出てくるときにエッジでアナリティクスを適用できることにより、必要なだけ早くアクションをとることができるため、決定することもできますが、このデータをすぐにコアに戻す必要がありますか? ここでそれをバッチ処理してから、断片として送り返して後で分析することはできますか? そして、それが私たちの多くの主要な顧客が見ていることです。
Dell Statisticaがこれを行う方法は、利用する能力があるためです。たとえば、Statistica内にニューラルネットワークを構築し、データランドスケープ内の別の場所にニューラルネットワークを配置したいとします。 これらのモデルと、Java、PPML、C、SQLなどの右側にあるすべての言語を出力する機能があり、Pythonも含まれています。スクリプトもエクスポートできます–そして、それを一元化されたプラットフォームから移動すると、必要な場所にそのモデルまたはアルゴリズムを展開できます。 また、前述したように、Dell Boomiを使用して実行する必要がある場所に置き、結果を戻すか、データを戻すか、データをスコアリングしてルールエンジンを使用してアクションを実行することができます。 これらのデータはすべて、このタイプのデータを調べ始めたときに重要なものになり、再度考え直します。
これは、Dezが述べたように、これらの図の左側から右側にデータを移動するために非常に高価になり、ネットワークに負担がかかるため、電話のほとんどのユーザーが行う必要のあることです。時間。 大したことではないように聞こえますが、工場に1万個のセンサーがある製造業のお客様を見てきました。 工場に1万個のセンサーがある場合、これらを1秒間に2回目のテストまたは信号で実行している場合でも、1日あたりこれらの個々のセンサーから8万4千行のデータについて話していることになります。 そして、データは間違いなく山積みになっており、ロビンはそれについて言及しました。 事前に、ソフトウェアとIoTデータを使用して人々が非常に興味深いことを成し遂げている2つの業界について説明しました。ビルディングオートメーション、エネルギー、ユーティリティは本当に重要なスペースです。 エネルギー施設内や自動化のための建物内で、システムの最適化、カスタマーサービス、そしてもちろん全体的な運用と保守まで、多くの作業が行われています。 そして、これらは非常に強力であると思われるいくつかのユースケースです。
私たちは以前にエッジ分析を行ってきたと思います。 前述したように、Statisticaには深いルーツがあります。 同社は30年近く前に設立されたので、IoTデータを分析と統合してしばらくの間、顧客がかなり戻ってきました。 また、Alliant Energyは、当社のユースケースまたは参照顧客の1つです。 そして、エネルギー会社が物理的なプラントで抱えている問題を想像できます。 物理的なプラントのレンガの壁を越えてスケーリングすることは困難であるため、Alliantのようなエネルギー企業は、基本的に製造プロセスを強化し、最高レベルに最適化する方法でエネルギー出力を最適化する方法を探しています。 また、Statisticaを使用して、工場内の炉を管理しています。 そして、科学の授業の初期に戻った私たち全員にとって、炉は熱を発生し、熱は蒸気を発生し、タービンは回転し、電気が得られることを知っています。 Alliantのような企業にとっての問題は、実際にこれらの大型サイクロン炉内で物がどのように加熱され燃焼するかを最適化することです。 また、汚染、炭素排出などの余分なコストを回避するために、出力を最適化します。 したがって、これらのすべてのデバイス、センサーを使用してこれらのサイクロン炉のいずれかの内部を監視し、そのセンサーデータをすべて取得して、継続的にエネルギープロセスを変更する必要があります。 そして、それはまさに、IoTという用語が超人気になる前の2007年頃から、アライアントに対してStatisticaが行ってきたことです。
Rebeccaの初期のポイントまで、データは確かに新しいものではありません。 それを処理して正しく使用する能力は、本当にエキサイティングなことが起こっている場所です。 今日、プレコールでヘルスケアについて少し話しましたが、患者ケアの改善、予防的メンテナンス、サプライチェーン管理、ヘルスケアの運用効率などを行うためのあらゆる種類のアプリケーションを見ています。 そして、それはかなり進行中であり、多くの異なるユースケースがあります。 Statisticaで私たちが非常に誇りに思っているのは、お客様のShire Biopharmaceuticalsとの提携です。 そして、シャイアは本当に治療が難しい病気のために特殊な薬を作っています。 そして、顧客のために薬のバッチを作成するとき、それは非常に高価なプロセスであり、その非常に高価なプロセスも時間がかかります。 製造プロセスについて考えてみると、課題はデータ全体に統一されており、システムにデータを入力し、情報を検証し、顧客をどのように支援するかを予測できるさまざまな方法で十分な柔軟性を備えています。 そして、ほとんどの情報を製造システムから引き出していたプロセス、そしてもちろんこれらの製造システムを駆動するデバイスとセンサー。 また、センサーデータ、IoTデータ、およびプロセスからの通常のデータの組み合わせを使用して、企業が損失を回避し、製造プロセスを最適化する方法の優れたユースケースです。
製造業、特にハイテク製造業が、この種の仕事とデータを中心に医療業界に利益をもたらしている好例です。 私はそれをまとめてデズとロビンに返す前に、他のいくつかのポイントを持っていると思います。 しかし、ご存知のように、環境内のどこにでもアナリティクスをプッシュできるというこのアイデアは、ほとんどの企業にとって非常に重要になると思います。 ソースから中央の場所に戻る従来の形式のETL-ingデータに拘束されることは、常に戦略に含まれますが、唯一の戦略ではありません。 今日では、はるかに柔軟なアプローチをとる必要があります。 前述のセキュリティを適用するには、ネットワークの負担を避け、エッジからのデータを管理およびフィルタリングし、長期的に維持する価値のあるデータ、移動する価値のあるデータを判断できるようにします最善の判断を下すために、ネットワークに、または作成時に分析する必要のあるデータを特定します。 このどこでも、どこでも分析的なアプローチは、Statisticaで非常に心に留めておくべきものであり、非常に熟達したものです。 そして、前述のスライドの1つである、モデルをさまざまな言語でエクスポートして、データが作成されるプラットフォームに合わせて調整できるようにする機能に戻ります。 そしてもちろん、これらのモデル用の配布デバイスを用意します。これもまた、テーブルに持ち込むものであり、非常に興奮しています。 今日の会話は、私たちのシステムにかなり長い間存在するこのデータについて本当に真剣に取り組むつもりであり、それを活用するための競争力と革新的な角度を見つけたい場合、過去に使用したこれらの制限モデルのいくつかから逃れることを可能にするいくつかの技術。
繰り返しますが、私のポイントは、IoTを実行する場合、コアでそれを実行し、データを取り込み、他のデータと一致させて分析を行う必要があると思います。 しかし、同様に重要またはおそらくさらに重要なのは、データに分析を配置し、アーキテクチャの中央側から分析を外側に移動して、前述の利点を得るために、この柔軟性を持たなければならないことです。前。 それは、私たちが誰であり、市場で何をしているのかということです。 そして、私たちはIoTに非常に興奮しており、間違いなく時代の到来であり、このタイプのデータで分析と重要なプロセスに影響を与える素晴らしい機会がここにいると考えています。
Rebecca Jozwiak:ショーン、どうもありがとう。本当に素晴らしいプレゼンテーションでした。 そして、Dezがおそらくあなたにいくつかの質問をしたいと思っていることを知っているので、Dez、私はあなたを先に行かせます。
Dez Blanchfield: 100万の質問がありますが、Robinにも同様の質問があるので知っています。 私が広く見ているものの一つは、出てくる質問です。私は、あなたが物事の中心にいるということを考えると、この経験であなたの経験についての洞察を得ることを本当に切望しています。 組織はこの課題に苦労しており、そのうちの何人かはクラウス・シュワブの「第4次産業革命」のようなものを読んだ直後にパニック発作を起こしたようです。 そして、この本に馴染みのない人たちは、本質的には紳士、私は教授だと思うクラウス・シュワブによる洞察であり、彼は教授であり、世界経済フォーラムの創立者であり、理事長であり、この本は本質的にこのユビキタスモノのインターネット全体が爆発し、世界全体に与える影響の一部です。 私が話している組織は、現在の環境を改修するか、すべての新しい環境、インフラストラクチャ、およびプラットフォームを構築するためにすべてを投資すべきかを確信していません。 Dell Statisticaでも、人々が現在の環境を改造し、プラットフォームを既存のインフラストラクチャに展開するのを見ていますか?それとも、すべての新しいインフラストラクチャの構築に集中し、この大洪水に備えるのを見ていますか?
Shawn Rogers:両方のタイプの顧客にサービスを提供する機会があり、市場にいる限り、それらの機会を広げることができます。 過去数年で新しいファブプラントを作成し、センサーデータ、IoT、そのプロセス全体を通してエッジからエンドツーエンドの分析を導入したお客様がいます。 しかし、私たちの顧客の大部分は、この種の仕事をしばらく行っているが、そのデータを無視せざるを得ない人々であると言わざるを得ないでしょう。 レベッカが先に指摘したのは、これは新しいデータではなく、この種の情報は非常に長い間さまざまな形式で利用可能でしたが、問題はそこにつながっていたことです。それを動かして、スマートに何かを成し遂げられる場所に持ってきてください。
それで、私たちの顧客のほとんどが今日持っているものを見ていて、デズ、あなたは前にこの点を指摘しました、これはそのビッグデータ革命の一部であり、本当にそれが何なのかと思いますデータ革命? 特定のシステムデータや製造データ、ビルディングオートメーションデータを無視する必要はもうありません。今では、それを取得してからスマートなことをするための適切なおもちゃやツールがあります。 そして、私はそれを実現しているドライバーがこのスペースにたくさんあり、そのうちのいくつかは技術的だと思います。 ご存知のように、Hadoopなどのビッグデータインフラストラクチャソリューションにより、この種の情報のデータレイクを作成することを考えるのが少し簡単になりました。 そして今、私たちは企業を見て回って、「ねえ、私たちの製造プロセスに分析がありますが、これらのプロセスから何らかの洞察を加えることができるなら、それらは強化されるでしょうか?」お客様がやっています。 ゼロから作成するのではなく、新しいデータで既存の分析を強化および最適化します。
Dez Blanchfield:ええ、私たちが見た最大の産業のいくつかで刺激的なことが起こっています。 航空はちょうどこのブームを経て、私が定期的に語る私のお気に入りのデバイスの1つであるボーイング787ドリームライナー、そして確かにエアバスの同等品であるA330が同じルートを下りました。 787が最初にリリースされたとき、787には約6, 000個のセンサーがありましたが、新しいバージョンでは1万5000個のセンサーについて話していると思います。 そして、その世界にいる一部の人々と話をすることについての不思議なことは、翼などにセンサーを配置するというアイデアと、設計プラットフォームで787について驚くべきことは、彼らがすべてを再発明したということです飛行機。 翼のように、たとえば、飛行機が翼を離陸するとき、最大12メートル半まで曲がります。 しかし、極端な場合、翼は最大25メートルまで先端で曲がることができます。 このことは鳥の羽ばたきのように見えます。 しかし、修正する時間がなかったのは、このすべてのデータの分析のエンジニアリングでした。したがって、何か問題が発生した場合にLEDを緑と赤に点滅させるセンサーがありますが、実際には深い洞察は得られませんリアルタイム。 また、米国内の空域には毎日87, 400便のフライトがあるため、データ量を移動する方法の問題も解決しませんでした。 すべての飛行機が787ドリームライナーの買収に追いつくと、これらの飛行機は現在それぞれ約半テラバイトのデータを作成するため、1日あたり43ペタバイトのデータになります。 また、米国国内で1日87, 400フライトに5テラバイトまたは半テラポイントを掛けると、43.5ペタバイトのデータになります。 それを物理的に動かすことはできません。 そのため、設計上、分析をデバイスにプッシュする必要があります。
しかし、このアーキテクチャ全体を見ると面白いことの1つであり、これについてあなたがどう思うかを知りたいと思っています。それは、データ管理の第一の原則、中央の場所にすべて。 データレイクがあり、必要に応じて小さなデータポンドを作成します。分析の対象となる抽出物を抽出しますが、特にデータベース担当者やデータマネージャーから寄せられるものの1つであるエッジに配布します。または情報を管理するビジネスの人々は、分散した小さなミニチュアデータレイクがたくさんあるとどうなりますか? ソリューションのエッジ分析に関して、この考え方にはどのようなものが適用されていますか?従来は、すべてがデータレイクに集中していたため、今ではどこにでも小さなデータの水たまりができてしまいますが、それらに対してローカルで分析を実行して、ローカルな洞察を得ます。あなたが直面した課題のいくつかとその解決方法、その分散データセット、特にデータレイクと分散エリアの縮図を取得するときはどうですか?
ショーン・ロジャース:まあ、それは挑戦の一つだと思いますよね? 離れて行くと、すべてのデータを中央の場所または私が与えたコア分析例にトラックバックしてから分散バージョンを実行すると、これらすべての小さなサイロになってしまいますか? あなたが描いたように、そうですか? 彼らは少し仕事をしていて、いくつかの分析は実行されていますが、どうやってそれらを元に戻すのですか? そして、鍵はそのすべてのオーケストレーションになると思いますし、皆さんも私に同意するだろうと思いますが、そうでない場合は私は満足しています、私たちはこの進化をかなり見ていると思いますしばらく。
友人のInmon氏とKimball氏が、初期のデータウェアハウスへの投資のアーキテクチャを誰もが支援していた時代に戻ります。ポイントは、この集中型モデルから長い間離れていたことです。 エコシステム内の最適な場所にデータの重力を示し、データを可能な限り最良のプラットフォームに合わせて最良の結果を得るというこの新しいアイデアを採用しました。 そして、私たちは生態系に対するより組織化されたアプローチを、物事を行うための包括的な方法として始めました。私たちはそれらのすべての要素を一度に揃えようとしています。 データをどのような種類の分析または作業に使用するのか、どのような種類のデータなのか、それがどこにあるべきかを決定するのに役立ちます。 どこで生成され、データにはどのような重力がありますか?
ご存じのように、これらのビッグデータの例の多くは、10ペタバイトと15ペタバイトのデータレイクを持つことについて人々が話しているところです。 それほど大きなデータレイクがある場合は、移動することは非常に非現実的であるため、分析をもたらす必要があります。 しかし、あなたがそれを行うとき、あなたの質問の中心に、環境を調整し、ガバナンスとセキュリティを適用し、それをキュレートし、管理するためにそのデータで何をする必要があるかを理解することは誰にとっても多くの新しい課題を引き起こすと思いますそれから最高の値を取得します。 正直に言うと、ここであなたの意見を聞きたいと思います。私たちはまだ早い時期にいると思いますし、まだやるべきことがたくさんあると思います。 Statisticaのようなプログラムは、より多くの人々にデータへのアクセスを提供することに焦点を当てていると思います。 私たちは、これまでなかったかもしれない組織内の場所に予測分析を推進したい市民データ科学者のようなこれらの新しいペルソナに間違いなく焦点を合わせています。 そして、これらはこの頃の初期の一部だと思いますが、成熟度のアークは、これらのプラットフォーム間の高レベルまたはオーケストレーションと整合性、およびそれらの内容と理由の理解を実証する必要があると思います。 そして、それは私たちすべてのデータ関係者にとって長年の問題です。
Dez Blanchfield:確かにそうであり、それに完全に同意します。今日ここで私たちが聞いている素晴らしいことは、少なくともエッジレベルでゲートウェイレベルで実際にデータをキャプチャする問題のフロントエンドだと思いますネットワークとその時点で分析を行う能力は、本質的に解決されました。 そして今では、分散データレイクという次の課題について実際に考え始めることができます。 本当にありがとうございました。素晴らしいプレゼンテーションでした。 私はそれについてあなたとチャットする機会を本当に感謝しています。
私は彼が持っていることを知っているので、今ロビンに渡すつもりです、そして、レベッカはロビンの後の聴衆からのすばらしい質問の長いリストも持っています。 ロビン?
ロビン・ブロア博士:わかりました。 ショーン、もう少し言いたいです。宣伝する機会を与えようとはしていませんが、実際には非常に重要です。 Statisticaが実際にモデルのエクスポート機能を生成したのはどの時点かを知りたいと思っています。 しかし、私はまた、これまでにBoomiについて言ってきたことは、それがETLであり、実際にはETLであるということなので、Boomiについて何か言ってほしいと思います。 しかし、実際には非常に有能なETLであり、私たちが話している種類のタイミングと、ここで議論しているいくつかの状況にとって、それは非常に重要なことです。 二つのことを話してくれませんか?
ショーン・ロジャース:確かに、そう、絶対にできる。 ご存知のように、この方向への私たちの動きは確かに反復的であり、段階的なプロセスのようなものでした。 今週、Statisticaのバージョン13.2をリリースする準備が整いました。 そして、私たちが今日話しているすべての機能の最新の更新があります。 しかし、1年前の10月にバージョン13に戻って、プラットフォームからモデルをエクスポートする機能を発表し、当時NDAAと呼んでいました。 頭字語はNative Distributed Analytics Architectureの略です。 私たちがやったことは、多くの時間とエネルギーを注ぎ、プラットフォームを開くことに集中し、高度な分析の中心的なコマンドセンターとして使用するだけでなく、そこから展開することです。 そして、最初に配置したロビンは、機械学習に関するプラットフォームに本当に素晴らしい追加を行いました。 したがって、StatisticaからMicrosoftのAzure Cloudにデプロイして、Azureのパワーを使用して機械学習を強化することができました。ご存知のように、非常に集中的であり、クラウドテクノロジーを活用する素晴らしい方法です。 それが最初のビットでした。
ここで、モデルをAzureにエクスポートし、Azureを使用してそれらを実行し、データまたは結果をStatisticaプラットフォームに送り返しました。 そして、エクスポートできるようにしたい他の言語に移動しましたが、もちろんJavaの1つは、モデルをHadoopのような他の場所に外部にエクスポートするための扉を開きます。私たちもそこに遊びます。
そして最後に、そのリリースのモデルをデータベースに出力できるようにすることに焦点を合わせました。 それが最初のイテレーションであり、正直なところ、エンドゲームはIoTでしたが、昨年10月のバージョン13にはまだありませんでした。 それ以来、私たちはそこに着きました。それは、私が今述べたすべてのことを行う能力に関係していますが、それから何らかの輸送装置を持っていることです。 Dezの質問に戻ります。これらの分析をすべて実行しているときに、どのような課題があり、これをどのように行うのでしょうか。 さて、Boomiを一種の配布ハブとして使用しています。これは、クラウドにあり、前述のように非常に強力であるため、データ統合プラットフォームですが、アプリケーション統合プラットフォームでもあり、JVMを使用して許可していますJava仮想マシンを着陸できる場所ならどこでも駐車して仕事をします。 これらすべてのゲートウェイ、エッジコンピューティングプラットフォーム、エッジサーバーは、JVMを実行できるコンピューティングとプラットフォームを備えているため、これらがすべての扉を本当に開きました。そして、JVMをどこでも実行できるため、Boomiは素晴らしいディストリビューションであり、以前の私の言葉を使用すると、オーケストレーションデバイスです。
これは非常に重要になっています。1分前の飛行機のシナリオは素晴らしいものだったと思います。工場で1万個のセンサーを持っているシャイアのようなメーカーも、ある時点で、高度な分析に対する一種の中心的なアプローチへの取り組みを開始する必要があります。 それについてアドホックであることは、実際にはもう機能しません。 以前は、実行していたモデルとアルゴリズムの量が最小限でしたが、現在は最大になっています。 組織には何千人もいます。 そのため、プラットフォームの一部はサーバーベースであり、エンタープライズソフトウェアを使用している場合は、環境全体でモデルを調整し、スコアを付けて管理することもできます。 そして、それもオーケストレーションの一部です。 最初にモデルを取得できるようにするだけでなく、必要に応じて継続的にモデルを調整し、継続的にモデルを交換するためのルートを提供するレイヤー、ロビンが必要でしたこれは手動で行うことはできません。 モデルをゲートウェイにアップロードしようとするサムドライブで製油所を歩き回ることはできません。 その間に輸送および管理システムが必要です。そのため、StatisticaとBoomiの組み合わせがそれをお客様に提供します。
ロビン・ブロア博士:ああ。 さて、私は非常に簡潔になりますが、データレイクと、特定の場所にペタバイトを蓄積するというアイデアと、重力があるという事実について以前に述べたこの声明です。 オーケストレーションについて話し始めたとき、非常に単純な事実について考えるようになりました。非常に大きなデータレイクを1か所に置くことは、おそらく実際にバックアップする必要があることを意味し、おそらくとにかく多くのデータを移動する必要があります。 私の意見では、とにかく、実際のデータアーキテクチャははるかに多く、あなたが話している方向にずっと近いものです。 それは賢明な場所にそれを配布することです、おそらく私が言うことです。 そして、これを行うための非常に優れた能力を持っているようです。 つまり、私はBoomiについて十分に説明されているので、何らかの方法で、それを見ることができるか、聴衆が見ることができないかのどちらかと言えば不公平です。 しかし、Boomiはアプリケーションの機能を持っているので、あなたがしていることの観点から、私にとっては非常に重要です。 また、問題の真実は、何らかの理由で何かを実行することなく、これらの分析計算を実行しないということです。 そして、Boomiがその役割を果たしますよね?
ショーン・ロジャース:ええ、絶対に。 そして、以前の会話から知っているように、Statisticaには本格的なビジネスルールエンジンが組み込まれています。 そして、なぜそうするのかを理解する上で、それは本当に重要だと思います。 ご存知のように、分析してデータを活用してより良い意思決定を行うか、行動を起こさない限り、IoTを実行する理由はまったくないということを冗談で言いました。 そのため、私たちが焦点を当てたのは、単にモデルを世に出すことができるだけでなく、それに合わせてタグを付けることができる、ルールセットです。 また、Boomiはある場所から別の場所に物事を移動する機能が非常に堅牢であるため、Boomiアトム内にトリガー、アラート、アクションを実行する機能を組み込むこともできます。
そして、そこからIoTデータのそのような洗練されたビューを取得し始めます。「わかりました、このデータは聞いてみる価値があります。」しかし、本当に、あなたは知っています、「ライトが点灯し、ライトが点灯し、 「ライトが点灯、ライトが点灯」は、ライトが消灯したとき、煙探知器が消灯したとき、または製造プロセスで発生したことが仕様から外れたときほど興味深いものではありません。 それが起こったとき、私たちはすぐに行動を取りたいと思います。 そして、この時点で、データはほぼ二次的になります。 それらすべてを保存することはそれほど重要ではないので、「大丈夫、大丈夫、大丈夫」というシグナルです。重要なのは、「ねえ、それは悪い」ということに気づき、すぐに行動を起こしたということです。 電子メールを誰かに送信するか、ドメインの専門知識を得ることができるか、または是正であろうと情報に対する応答であろうと、すぐに行動を起こすために他の一連のプロセスを開始するかどうか。 そして、それがあなたがこの組織化された見方を持たなければならない理由だと思います。 アルゴリズムをあちこちで扱うことに集中することはできません。 それらを調整し、調整できる必要があります。 あなたは彼らのパフォーマンスを見ることができる必要があります。 そして本当に、最も重要なことは、データに対して即座にアクションを取る機会を追加できないのに、なぜこれを行うのかということです。
ロビン・ブロア博士:わかりました、レベッカ、聴衆から質問があると思いますか?
Rebecca Jozwiak:します。 たくさんの聴衆の質問があります。 ショーン、あなたは時間を過ぎてあまりにも長く付きたくなかったと知っています。 どう思いますか?
ショーン・ロジャース:うれしいです。 どうぞ。 いくつか答えることができます。
Rebecca Jozwiak:見てみましょう。 あなたが言及したことの1つは、IoTは初期段階にあり、それは行われなければならないある程度の成熟度を持っているということでした、そしてそれは一種の出席者が尋ねたこの質問に話します。 IPv6フレームワークが、今後5年または10年でIoTの成長に対応できるほど堅牢になるとしたら、どうでしょうか。
Shawn Rogers:ああ、Dezに私の答えをエコーさせます。なぜなら、彼は私がこの種の情報に近いと思うからです。 しかし、私は常に、私たちが実施しているフレームワークのほとんどを曲げたり壊したりするための非常に速い軌道に乗っていると考えてきました。 そして、その新しい種類の仕様を追加すること、またはIPv6フレームワークを使用する方向性が重要であると思いますが、それにより、より多くのデバイスを持ち、すべてを提供できるようになります。住所を教えたい 顧客と一緒に読んだり見たりするすべてのものと、必要な住所の数が、ある時点でその風景に別の変化を引き起こすと思います。 しかし、私は実際にはネットワークの専門家ではないので、ある時点でそれを破るつもりであると100パーセント言うことはできません。 しかし、私の経験から、ある時点でそのモデルを混乱させることがわかります。
Rebecca Jozwiak:驚かないでしょう。 フレームワークは、あらゆる種類の物事の重みの下で壊れているようなものだと思います。 そして、それは論理的ですよね? つまり、タイプライターでメールを送信することはできません。 別の参加者は、「Hadoopフレームワークを使用できますか?」と尋ねていますが、それを変更して、分散分析にHadoopフレームワークをどのように使用すると思いますか?
Shawn Rogers:まあ、Robinは私に歴史的な質問をすることを好んでくれたので、Statisticaのバージョン13以降、モデルをシステムからHadoopに追い込むことができました。 そして、Hadoopのすべての大きなフレーバーと密接に連携しています。 私たちは、主なHadoopディストリビューションの1つとしてClouderaと連携する能力に関して、非常に素晴らしいサクセスストーリーを持っています。 しかし、Javaで出力できるため、オープンで分析をどこにでも配置できるようになります。 それらをHadoopクラスターに配置することは、多くのお客様にとって通常および定期的かつ日常的に行っていることです。 簡単な答えは、はい、絶対です。
Rebecca Jozwiak:すばらしい。 そして、私はあなたにもう1つ投げて、あなたがあなたの休暇を続けられるようにするつもりです。 別の出席者は、IoT分析と機械学習を使用して、すべてのデータを履歴目的で保存する必要があると考えていますか?それはソリューションアーキテクチャにどのように影響しますか?
Shawn Rogers:そうですね、すべてのデータを保存する必要はないと思います。 しかし、どこから来ても、組織内で必要なデータソースを楽しませ、聞く能力があることは非常に興味深いと思います。 そして、ここ数年の間に市場で見られた変化は、私たちが物事へのそのすべてのデータのアプローチをとることを可能にしたと思います、そしてそれは本当に一種の報いのようです。 しかし、企業やユースケースごとに異なるでしょう。 健康データを見ると、多くの規制上の問題、懸念すべきコンプライアンスの問題が多くあり、それが他の企業がなぜそれを保存する必要があるのか理解できないかもしれないデータを保存します? 製造プロセスでは、多くの製造業のお客様にとって、プロセスを歴史的に調査し、大量のデータを振り返ってそこから学習し、より良いモデルを構築できるという利点があります。
多くのデータを保持する必要があると思いますし、今日、それをより経済的でスケーラブルにするソリューションがあると思います。 しかし同時に、すべての企業が原子レベルで維持する必要のないデータの価値を見つけると思いますが、リアルタイムの分析を行い、その中のイノベーションを推進するために意思決定をしたいと思うでしょう。彼らの会社。
Rebecca Jozwiak:わかりました。 いいえ、聴衆、今日はみんなの質問に答えることはできませんでしたが、ショーンに直接転送して、彼があなたに直接連絡してそれらの質問に答えられるようにします。 しかし、皆さん、出席してくれてありがとう。 Dell StatisticaおよびすべてのアナリストDez BlanchfieldおよびDr. Robin BloorのShawn Rogersに感謝します。 このアーカイブは、insideanalysis.com、SlideShareで見つけることができます。私たちは再びその内容を元に戻し始めています。YouTubeを改良しているので、それも同様に探してください。 どうもありがとう。 そしてそれで私はあなたに別れを告げるつもりです、そして私たちはあなたにまた会いましょう。