狠狠撸

狠狠撸Share a Scribd company logo
2011年11月19日
楽天テクノロジーカンファレンス2011



       ビッグデータ革命
   クラウドがコモデティ化する「奇跡」



          日経コンピュータ編集部
              中田 敦
            @Nakada_itpro
自己紹介
中田 敦(なかだ あつし)
 @Nakada_itpro
「日経コンピュータ」編集部 記者
1998年4月     日経BP社入社、「日経レストラン」編集部に配属
2000年9月     ITニュースサイト「BizTech」編集部に異動
2002年10月    「日経Windowsプロ」編集部に異動
2006年1月     ITニュースサイト「ITpro」編集部に異動
2008年4~6月   米国でクラウド?コンピューティング事情を取材
2008年10月    「日経コンピュータ」編集部に異動
2009年4月     「クラウド大全」刊行
2010年4月     「クラウド大全 第二版」刊行
はじめに



   最近、「奇跡」が
 現実化し始めていることを
    ご存じですか?
2011年7月
米国カリフォルニア




            2011年7月

            米国カリフォルニア州
            サンタクルーズ市では
            犯罪が発生する前に、
            警察官が犯罪現場に
            現れるようになった
2010年10月
東京




 コンピュータ将棋
 「あから」

 女流名人に胜つ
2010年10月
東京


             以下のソフトの合議制

             ?激指
             ?GPS将棋
             ?Bonanza
             ?YSS

             これらソフトの共通点は
             「Bonanzaメソッド」
  コンピュータ将棋   Bonanzaの開発者は、将棋が強く
    「あから」    ない化学者
2010年10月
米国カリフォルニア




            周囲の状況をビデオカメラで捉え、
            自律的に判断する「自動運転自動車」を
            米Googleが開発

            米カリフォルニア州の公道を22万キロメート
            ル無事故で走った。
Google Self-Driving Carで検索

 ? http://www.youtube.com/watch?v=Y
   aGJ6nH36uI
 ? http://www.youtube.com/watch?v=e
   XeUu_Y6WOw
「奇跡」の共通点は
大量データに対する高度な分析
業務システム   様々な    CRMシステム   Webサイト、   ソーシャル
                                              静止画、動画   センサーデータ
のデータ     ログファイル のデータ      ブログ       ネットワーク
                                    サイト

                          インター
                           ネット




                 ビッグデータ + 機械学習 + 高速な判断

             異変を察知         近未来を予測            今を描き出す



   不可能が可能に                後発が先発に勝つ            社会がより良くなる
 周囲の状況を判断して自律的        将棋初心者の化学者が作った          犯罪が発生する前に、犯罪現
 に走行する「自動運転自動         コンピュータ将棋ソフトが、          場に警察官が現れる
 車」を検索エンジン会社が作        プロ棋士に勝つ
 り始めた
                          ビッグデータ革命
コンピュータ将棋
強さの秘密は「機械学習」

●いままでのコンピュータ将棋プログラム



    将棋知識          学習            チューニング




                       プログラマー

●現在のコンピュータ将棋プログラム

            可変長
           可変長
          可変長
           テキスト
         可変長
          テキスト
         棋譜
         テキスト           機械学習
        テキスト
      (ログデータ)
ビッグデータの力に気付いた
米グーグル


電力産業                   自動車産業
Googleや丸紅が出資して、大西洋沖の
洋上風力発電所と米国東部を結ぶ海底      フォードとグーグルが提携して、プ
                                          車体についた画像センサーが
送電網を建設。                ラグイン?ハイブリッド?カーの走
                                          周辺の状況を判断する「自動
                       行システムを開発。移動履歴から
                                          運転カー」を開発中
                       ユーザーの行動を予測し、最適な燃
                       料配分を提案する
            総事業費は最
            大5000億円。
            600万KWを供
            給予定




広告?メディア産業              IT?家電産業
                                                クラウド
                          スマートフォン
                                                コンピューティン
                          デジタル家電
                                                グ
2010年10月12日発表
グーグル、巨大送電網建設へ
5000亿円、600万碍奥?

                ?Googleや丸紅が出資して、大
                西洋沖の洋上風力発電所と米国
                東部を結ぶ大規模な海底送電網
                を建設する

                ?洋上風力発電所は、独立系発
                電事業者が建設。それをニュー
                ジャージ州、デラウエア州、メ
                リーランド州、バージニア州に
                送る

                ?総事業費は最大5000億円。
                6000MW(600万KW)を供給
                する
Google公式ブログより
5000亿円、600万碍奥?


 東京電力の最大電力      Google/丸紅の最大
  2009年7月30日          電力

   5450万KW          600万KW
  (54,500MW)       (6,000MW)


           東京電力が供給する最大電力の10分の1強を、
           Google/丸紅連合が供給可能(しかも風力発電)
ビッグデータブーム到来

          「ビッグデータ」市場に
          大手ベンダーがこぞって参入中




              ビッグデータ技術が
              あっという間にコモデティ化




              ビッグデータ革命、到来!
米フォード
グーグルと組んで自動車クラウド
ビッグデータのパターン
   大量に               深く               素早く
 様々な種類のデータを、      大量のデータの中から、       現実世界で発生するイ
 大量に保存する          コンピュータが自動的        ベントをいち早くつか
                  にパターンやルールを        み、ルールと照らし合
                  見つけ出す             わせて状況を判断し、
                                    アクションに移す

                                       現実世界


                                      マッチング      アクション

    データ
                   パターンやルール



 実現するための技術
                                      パターンやルール
 ?Hadoop          ?機械学習             ?CEP
 ?NoSQL           ?データマイニング         ?ストリーミング処理
 ?キーバリュー型         ?GPGPU            ?インメモリー
 データストア           ?インデックス作成          データベース



             これらの技術をクラウドサービスとして提供       手軽に
「大量に」を支える
 データスペース

 「データベース」から「デー
 タスペース」への進化が必要                                  これから
                  構造化データ、非構造化データの双方をカバー

                            データスペース

    構造化データ                        非構造化データ


       基幹系            情報系
       データ            データ

                               テキスト    静止画   動画     音声



      RDB         DWH                  検索システム


             データベース    データの種類毎に、異なるシステムで管理        これまで
                       していた
「深く」を特徴付ける
 機械学習

    最近のデータマイニングで
    よく使われるようになった手法

    教師付き機械学習         教師無し機械学習
                     (応用例)異常検知
    ベイジアンフィルター       (応用例)高度なクラスタリング
    (応用例)迷惑メール判定

    協調フィルタリング
    (応用例)レコメンデーション      従来のデータマイニングで
                        主に使われていた分析手法
    複雑ネットワーク
    (応用例)レコメンデーション     相関分析
                       (応用例)問題点の発見
    その他の手法
    (応用例)信用リスク評価
                       回帰分析
         テキスト分類
                       (応用例)需要予測
         画像認識

                       クラスタリング
                       (応用例)顧客の分類
ポイントは自動化
●従来のAI:人間がデータを学習してモデル化                    ●ビッグデータ時代のアプリケーション

          学習               モデル化                      学習       モデル化

                                            ビッグ
  データ
                                            データ


               人間                  モデル
                                                          コンピュータ     モデル




●従来のBI:人間がBIレポートを見ながら判断                                        モデル

               人間

         可視化
                      判断                          コンピュータ
                                                               判断
  イベント                            アクション    イベント                       アクション

                     BI                                      マッチング
                    レポート                      パターン
                                              認識

                                                  パターン
応用パターン
異変を察知する

   マーケティング        セキュリティ           環境保全
?突発的な流行の検出     ?サイバー攻撃の検出     ?河川の水質汚染、大気汚染
?人気検索ワードの検出                   の兆候を検出撃を発見



    医療/介護        コンプライアンス          通信事業
?新生児の体調不良を検出   ?インサイダー取引など不   ?サービスレベル低下の検出
?独居老人の見守り      正行為の検出         ?通信機器故障の予測



     製造業          システム運用           金融業
?完成品の不具合の検出    ?サーバーやパーツの故障   ?クレジットカードの不正利
?製造装置の故障予測     予測             用の検出
応用パターン
異変を察知する
●様々なログから「社員の不正」を検出
     総務部     情報の所轄部署    情報システム部
                                               人事部




                        業務アプリ
                         業務アプリ
                        ケーション
                         ケーション      顧客DB      人事DB



     ビルの
               ネットワーク
   入退館システム
                                           組織の垣根を越えて情報を収集

                         ArcSight


           「退職2週間前の社員Aが、休日にオフィスに入り、
           CRM(顧客関係管理システム)にアクセス。顧客
           データを抜き出した」→不正検出!
応用パターン
近未来を予測する
●サイバーエージェントによる「退会を予測する」取り組み


      ①ユーザーの行動履歴を分析          ②Webサーバーのログデー    ③何らかの「特典」などを付
      して、「退会」につながりそ          タをリアルタイムに分析して、   与して、ユーザーに退会を思
      うな行動の予兆を見つけ出す          ユーザーの「退会しそうな兆    い留まらせる
                             候」を見つけ出す


        ☆ → ● → △ → ■ → 退会      Webサーバー
                                 ログデータ             特典
        ● → △ → ■ → ☆ → 退会
 会員                              リアルタイム
        × → ● → △ → ◇ → 退会        Hadoop


        □ → ☆ → ● → △ → 退会         ●→△
応用パターン
近未来を予測する
●フォードのPHV向けカーナビ
    ②データからユー                                              カーナビの画面
    ザーの走行パターン
    を分析
                Google Storage
                         パターン
           データ                   Prediction API


  ①自動車の走
  行履歴を蓄積              ③時刻や場所
                      情報を伝達
                                                  ④時刻や場所情報
                                                  から目的地を予測。
                                                  最適ルートや燃費
                                                  パターンを予測

                                                               ⑤排気ガスの発生が規
                                                               制された「グリーン
                                                               ゾーン」での走行が予
                                                               想される場合は、バッ
                                                               テリーを節約する

                            フォードのプラグインハイブリッド(PHV)カー


                                                  API:アプリケーション?プログラミング?インターフェース
応用パターン
今を描き出す
●マイニングブラウニーの「MitsuBachi」

 Webサイト、ブログ                ●競合はどうしている?
                           メディアサイトに掲載されてい
   インター                    る広告バナーのサイズや掲載数
   ネット                     などから競合企業が支払ってい
                           る広告費用を推定

                           ●経済活動はどうなっている?
 ソーシャルネット                  不動産情報サイトに掲載されて
 ワークサイト                    いる物件情報を分析すれば、ど
                           の地域で再開発が始まったか分
                           かる。再開発地域では、築年数
                           の古い物件が減り始めるから
オラクルもHadoop
マイクロソフトもHadoop
大手ベンダーが
こぞってHadoop関連の取り組み
 会社名              時期       主な施策
 米EMC           2010年7月    DWH「Greenplum」のベンダー、米グリーンプラムを買収
                2011年4月    ネットワークパケット解析ツール「NetWitness」のベンダー、米ネットウィットネスを買収
                2011年下期    Hadoopディストリビューション「Greenplum HD」を出荷予定
                2011年下期    「Greenplum」とデータマイニングソフト「SAS」を統合したアプライアンスを出荷予定
 米ヒューレットパッカード   2010年9月    統合ログ監視ソフト「ArcSight」のベンダー、米アークサイトを買収
                2011年2月    カラム指向DB「Vertica」のベンダー、米バーティカを買収
                2011年4月    「Hadoop」専用のPCサーバーハードウエアを発売
                2011年8月    検索エンジンソフト「Autonomy」のベンダー、英オートノミーに買収提案
 米IBM           2009年7月    データマイニングソフト「SPSS」のベンダー、米SPSSを買収
                2010年3月    ストリーミング処理ソフト「InfoSphere Streams」を出荷
                2010年9月    DWH「Netezza」のベンダー、米ネティーザを買収
                2011年6月    Hadoopベースのデータ分析ソフト「InfoSphere BigInsights」を発売
 米マイクロソフト       2008年1月    検索エンジンソフト「FAST」のベンダー、フィンランド?サーチ&トランスファーを買収
                2011年5月    並列プログラミング基盤「LINQ to HPC(開発コード名:Dryad)」を出荷
                2011年末~    Windows Server、Windows Azure向けの「Hadoop」を提供予定
                 2012年     SQL Server次期バージョン(開発コード名Denali)に、カラム指向DB機能を搭載
 米ネットアップ        2011年6月    HadoopにRAID機能を追加する「Hadoop Open Storage System」を発表
 米オラクル          2011年10月   Hadoopアプライアンス「Oracle Big Data Appliance」を発表
 米SAP           2010年5月    データベース/DWHベンダーの米サイベースを買収
                2010年12月   インメモリーデータベース「SAP HANA」を発売
 NEC            2011年内     インメモリーデータベースを発売予定
                 開発中       ミッションクリティカル用途に特化した「MC Hadoop」を開発中
 富士通            2011年8月    ビッグデータPaaS「SPATIOWL(スペーシオウル)」を発表
                 開発中       ストレージ装置「ETERNUS」上で稼働するHadoopを開発中
 日立製作所          2011年1月    Hadoopの導入支援サービスを開始
                 開発中       検索性能に特化した「アウトオブオーダー実行型データベース」を開発中
 NTTデータ          開発中       機械学習アルゴリズム「K平均法」をGPGPUを使って解くプログラムを開発中
课题は人材
「Growth Team」を作ろう

? Growth Teamは、サービスの成長
  (Growth)に責任を持ったエンジニア
  チームという意味。Dropboxが最初に始
  めた取り組みで、ベイエリア界隈のス
  タートアップで増えている(らしい)
顿谤辞辫产辞虫の例



            “Growth Enginner”を募集中
顿谤辞辫产辞虫の例
Dropbox is one of the fastest growing startups on the Internet. We
want to become the way the world stores and shares files, and we're
well on our way.

It isn't a mystery why: users love it. But also, we've built tools which
make Dropbox easy to spread. We're kicking this into overdrive by
expanding the Growth Team. A growth engineer would substantially
contribute to Dropbox's continued success. The process is simple:
measure everything to understand it, come up with new ideas, test
the best ones, launch the best performing, and repeat this all as
quickly as possible.

For the growth engineer, the questions become: how can we scale
our analytics systems? What insights can we extract from our wealth
of data to inspire the more incisive ideas? What tools can we build to
run tests with dexterity?
顿谤辞辫产辞虫の例
Role & Responsibilities:
?Gather and process data from the Dropbox production servers
?Scale our MySQL analytics databases
?Measuring growth, usage rates of various Dropbox features, overall
activity levels, cost, revenue, and much, much more
?Build and maintain web interfaces and dashboards to display
Dropbox metrics
?Analyze user data to help determine what kinds of improvements
Dropbox should make
?Work with the Dropbox web, mobile, and client teams to run
experiments on their respective platforms
?Code in Python, HTML, Javascript, CSS, and possibly also C++
?Continuously improve the quality of the analytics code base
顿谤辞辫产辞虫の例
Requirements:
?Bachelor's degree in Computer Science.
?Math doesn't intimidate you
?Unix/Linux proficiency
?SQL proficiency
?Writing high quality, easy to understand code is important to you for
practical reasons, but also a little bit "just because".
?You're obsessive about correctness and edge cases, but at the same
time understand when to make sacrifices for practical reasons
?A desire to go the extra mile and hold your projects to a higher
standard - you're the biggest critic of anything you do and have an
appetite for solving problems and making things better
?Good product sense - you can see things from both the
growth/engineering and the general Dropbox user's standpoint
顿谤辞辫产辞虫の例
Nice-to-Have's:
?Startup experience
?Proficient in Python
?Proficient with HTML/CSS/Javascript
?Proficient in C++
?Experience with managing servers / sysadmin experience
?DBAdmin experience
?Experience with distributed version control systems (Mercurial, Git).
?Strong mathematical and statistical background
おしまい


  ありがとう
 ございました

More Related Content

What's hot (20)

Jupyter Notebook Ops
Jupyter Notebook OpsJupyter Notebook Ops
Jupyter Notebook Ops
Atsushi Sumita
?
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
dstn
?
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
株式会社クライム
?
これからのデータセンターが目指す技术(公开用)
これからのデータセンターが目指す技术(公开用) これからのデータセンターが目指す技术(公开用)
これからのデータセンターが目指す技术(公开用)
Tadashi Sugita
?
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
Ryoma Nagata
?
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食い
Ryuji Tamagawa
?
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Hideo Takagi
?
【轮読会】実践的データ基盘への処方笺
【轮読会】実践的データ基盘への処方笺【轮読会】実践的データ基盘への処方笺
【轮読会】実践的データ基盘への処方笺
Momota Sasaki
?
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
de:code 2017
?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
?
データプロダクトを支えるビッグデータ基盘
データプロダクトを支えるビッグデータ基盘データプロダクトを支えるビッグデータ基盘
データプロダクトを支えるビッグデータ基盘
Google Cloud Platform - Japan
?
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
?
第1回関西ソーシャルゲーム勉強会 kpi発表
第1回関西ソーシャルゲーム勉強会 kpi発表第1回関西ソーシャルゲーム勉強会 kpi発表
第1回関西ソーシャルゲーム勉強会 kpi発表
OCHI Shuji
?
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
dstn
?
Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflow
Ryoma Nagata
?
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
Yosuke Katsuki
?
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Ryoma Nagata
?
データ分析基盤運?チームの 運?業務を改善してみた話
データ分析基盤運?チームの 運?業務を改善してみた話データ分析基盤運?チームの 運?業務を改善してみた話
データ分析基盤運?チームの 運?業務を改善してみた話
Recruit Lifestyle Co., Ltd.
?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
Takahiro Inoue
?
Delta lakesummary
Delta lakesummaryDelta lakesummary
Delta lakesummary
Ryoma Nagata
?
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
dstn
?
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
『多種DBからKafka、Hadoop、S3への対応 データ統合/分析基盤へ簡単連携!』
株式会社クライム
?
これからのデータセンターが目指す技术(公开用)
これからのデータセンターが目指す技术(公开用) これからのデータセンターが目指す技术(公开用)
これからのデータセンターが目指す技术(公开用)
Tadashi Sugita
?
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
Ryoma Nagata
?
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食い
Ryuji Tamagawa
?
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Hideo Takagi
?
【轮読会】実践的データ基盘への処方笺
【轮読会】実践的データ基盘への処方笺【轮読会】実践的データ基盘への処方笺
【轮読会】実践的データ基盘への処方笺
Momota Sasaki
?
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
de:code 2017
?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
?
データプロダクトを支えるビッグデータ基盘
データプロダクトを支えるビッグデータ基盘データプロダクトを支えるビッグデータ基盘
データプロダクトを支えるビッグデータ基盘
Google Cloud Platform - Japan
?
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
Kuninobu SaSaki
?
第1回関西ソーシャルゲーム勉強会 kpi発表
第1回関西ソーシャルゲーム勉強会 kpi発表第1回関西ソーシャルゲーム勉強会 kpi発表
第1回関西ソーシャルゲーム勉強会 kpi発表
OCHI Shuji
?
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
2015年2月26日 dsthHUB 『オンプレミスとクラウドをシームレスに"つなぐ" 新製品「Thunderbus」の全貌』
dstn
?
Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflow
Ryoma Nagata
?
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
Yosuke Katsuki
?
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Ryoma Nagata
?
データ分析基盤運?チームの 運?業務を改善してみた話
データ分析基盤運?チームの 運?業務を改善してみた話データ分析基盤運?チームの 運?業務を改善してみた話
データ分析基盤運?チームの 運?業務を改善してみた話
Recruit Lifestyle Co., Ltd.
?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
トレシ?ャーテ?ータと迟补产濒别补耻実现する自动レホ?ーティンク?
Takahiro Inoue
?

Similar to ビッグデータ革命 クラウドがコモデティ化する「奇跡」 (20)

避けては通れないビッグデータ周辺の重要课题
避けては通れないビッグデータ周辺の重要课题避けては通れないビッグデータ周辺の重要课题
避けては通れないビッグデータ周辺の重要课题
kurikiyo
?
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
Mie Mori
?
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
滨辞罢ビジネス共创ラボ
?
ビッグデータ時代にむけて/濱田 正彦
ビッグデータ時代にむけて/濱田 正彦ビッグデータ時代にむけて/濱田 正彦
ビッグデータ時代にむけて/濱田 正彦
Takumi Kurosawa
?
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォームJubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
?
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
Naoki (Neo) SATO
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
Masanori Saito
?
DLL: Ignite2019 CognitiveServices Update 20191127
DLL: Ignite2019 CognitiveServices Update 20191127DLL: Ignite2019 CognitiveServices Update 20191127
DLL: Ignite2019 CognitiveServices Update 20191127
Ayako Omori
?
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Daisuke Masubuchi
?
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Azure 相談センター
?
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
The Japan DataScientist Society
?
BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話
Masato Kawada
?
ビッグデータ活用とサーバー基盘
ビッグデータ活用とサーバー基盘ビッグデータ活用とサーバー基盘
ビッグデータ活用とサーバー基盘
日本ヒューレット?パッカード株式会社
?
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
Takashi Okawa
?
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
Daiyu Hatakeyama
?
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~ ?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
Brocade
?
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI PlatformQiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
?
20140608 interlop keynote
20140608 interlop keynote20140608 interlop keynote
20140608 interlop keynote
SORACOM, INC
?
避けては通れないビッグデータ周辺の重要课题
避けては通れないビッグデータ周辺の重要课题避けては通れないビッグデータ周辺の重要课题
避けては通れないビッグデータ周辺の重要课题
kurikiyo
?
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
Mie Mori
?
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
20170922_4_Azure IoT , Cognitive Services で何が実現できるのか? -最新の事例とサービスアップデートのご紹介-
滨辞罢ビジネス共创ラボ
?
ビッグデータ時代にむけて/濱田 正彦
ビッグデータ時代にむけて/濱田 正彦ビッグデータ時代にむけて/濱田 正彦
ビッグデータ時代にむけて/濱田 正彦
Takumi Kurosawa
?
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォームJubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
?
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
[Developers Summit 2018] Microsoft AIプラットフォームによるインテリジェント アプリケーションの構築
Naoki (Neo) SATO
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
【新入社員研修】最新のITトレント?とビジネス 2017年度 改訂版
Masanori Saito
?
DLL: Ignite2019 CognitiveServices Update 20191127
DLL: Ignite2019 CognitiveServices Update 20191127DLL: Ignite2019 CognitiveServices Update 20191127
DLL: Ignite2019 CognitiveServices Update 20191127
Ayako Omori
?
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Daisuke Masubuchi
?
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Web制作会社様向け 知って得するMicrosoft Azureの概要と使い方!
Azure 相談センター
?
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
The Japan DataScientist Society
?
BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話
Masato Kawada
?
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
Takashi Okawa
?
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
20190924 沖縄ISCO AI セミナー: AIを自分の糧とするためのコツ
Daiyu Hatakeyama
?
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~ ?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
?インテル x ブロケード 特別対談? 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
Brocade
?
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI PlatformQiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
?
20140608 interlop keynote
20140608 interlop keynote20140608 interlop keynote
20140608 interlop keynote
SORACOM, INC
?

Recently uploaded (11)

2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
CRI Japan, Inc.
?
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
sugiuralab
?
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
Matsushita Laboratory
?
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3
LFDT Tokyo Meetup
?
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
Matsushita Laboratory
?
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
Industrial Technology Research Institute (ITRI)(工業技術研究院, 工研院)
?
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
sugiuralab
?
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
NTT DATA Technology & Innovation
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
Matsushita Laboratory
?
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
CRI Japan, Inc.
?
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
sugiuralab
?
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
Matsushita Laboratory
?
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3
LFDT Tokyo Meetup
?
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
Matsushita Laboratory
?
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
Industrial Technology Research Institute (ITRI)(工業技術研究院, 工研院)
?
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
sugiuralab
?
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
NTT DATA Technology & Innovation
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
Matsushita Laboratory
?

ビッグデータ革命 クラウドがコモデティ化する「奇跡」

  • 1. 2011年11月19日 楽天テクノロジーカンファレンス2011 ビッグデータ革命 クラウドがコモデティ化する「奇跡」 日経コンピュータ編集部 中田 敦 @Nakada_itpro
  • 2. 自己紹介 中田 敦(なかだ あつし) @Nakada_itpro 「日経コンピュータ」編集部 記者 1998年4月 日経BP社入社、「日経レストラン」編集部に配属 2000年9月 ITニュースサイト「BizTech」編集部に異動 2002年10月 「日経Windowsプロ」編集部に異動 2006年1月 ITニュースサイト「ITpro」編集部に異動 2008年4~6月 米国でクラウド?コンピューティング事情を取材 2008年10月 「日経コンピュータ」編集部に異動 2009年4月 「クラウド大全」刊行 2010年4月 「クラウド大全 第二版」刊行
  • 3. はじめに 最近、「奇跡」が 現実化し始めていることを ご存じですか?
  • 4. 2011年7月 米国カリフォルニア 2011年7月 米国カリフォルニア州 サンタクルーズ市では 犯罪が発生する前に、 警察官が犯罪現場に 現れるようになった
  • 6. 2010年10月 東京 以下のソフトの合議制 ?激指 ?GPS将棋 ?Bonanza ?YSS これらソフトの共通点は 「Bonanzaメソッド」 コンピュータ将棋 Bonanzaの開発者は、将棋が強く 「あから」 ない化学者
  • 7. 2010年10月 米国カリフォルニア 周囲の状況をビデオカメラで捉え、 自律的に判断する「自動運転自動車」を 米Googleが開発 米カリフォルニア州の公道を22万キロメート ル無事故で走った。
  • 8. Google Self-Driving Carで検索 ? http://www.youtube.com/watch?v=Y aGJ6nH36uI ? http://www.youtube.com/watch?v=e XeUu_Y6WOw
  • 9. 「奇跡」の共通点は 大量データに対する高度な分析 業務システム 様々な CRMシステム Webサイト、 ソーシャル 静止画、動画 センサーデータ のデータ ログファイル のデータ ブログ ネットワーク サイト インター ネット ビッグデータ + 機械学習 + 高速な判断 異変を察知 近未来を予測 今を描き出す 不可能が可能に 後発が先発に勝つ 社会がより良くなる 周囲の状況を判断して自律的 将棋初心者の化学者が作った 犯罪が発生する前に、犯罪現 に走行する「自動運転自動 コンピュータ将棋ソフトが、 場に警察官が現れる 車」を検索エンジン会社が作 プロ棋士に勝つ り始めた ビッグデータ革命
  • 10. コンピュータ将棋 強さの秘密は「機械学習」 ●いままでのコンピュータ将棋プログラム 将棋知識 学習 チューニング プログラマー ●現在のコンピュータ将棋プログラム 可変長 可変長 可変長 テキスト 可変長 テキスト 棋譜 テキスト 機械学習 テキスト (ログデータ)
  • 11. ビッグデータの力に気付いた 米グーグル 電力産業 自動車産業 Googleや丸紅が出資して、大西洋沖の 洋上風力発電所と米国東部を結ぶ海底 フォードとグーグルが提携して、プ 車体についた画像センサーが 送電網を建設。 ラグイン?ハイブリッド?カーの走 周辺の状況を判断する「自動 行システムを開発。移動履歴から 運転カー」を開発中 ユーザーの行動を予測し、最適な燃 料配分を提案する 総事業費は最 大5000億円。 600万KWを供 給予定 広告?メディア産業 IT?家電産業 クラウド スマートフォン コンピューティン デジタル家電 グ
  • 13. 5000亿円、600万碍奥? ?Googleや丸紅が出資して、大 西洋沖の洋上風力発電所と米国 東部を結ぶ大規模な海底送電網 を建設する ?洋上風力発電所は、独立系発 電事業者が建設。それをニュー ジャージ州、デラウエア州、メ リーランド州、バージニア州に 送る ?総事業費は最大5000億円。 6000MW(600万KW)を供給 する Google公式ブログより
  • 14. 5000亿円、600万碍奥? 東京電力の最大電力 Google/丸紅の最大 2009年7月30日 電力 5450万KW 600万KW (54,500MW) (6,000MW) 東京電力が供給する最大電力の10分の1強を、 Google/丸紅連合が供給可能(しかも風力発電)
  • 15. ビッグデータブーム到来 「ビッグデータ」市場に 大手ベンダーがこぞって参入中 ビッグデータ技術が あっという間にコモデティ化 ビッグデータ革命、到来!
  • 17. ビッグデータのパターン 大量に 深く 素早く 様々な種類のデータを、 大量のデータの中から、 現実世界で発生するイ 大量に保存する コンピュータが自動的 ベントをいち早くつか にパターンやルールを み、ルールと照らし合 見つけ出す わせて状況を判断し、 アクションに移す 現実世界 マッチング アクション データ パターンやルール 実現するための技術 パターンやルール ?Hadoop ?機械学習 ?CEP ?NoSQL ?データマイニング ?ストリーミング処理 ?キーバリュー型 ?GPGPU ?インメモリー データストア ?インデックス作成 データベース これらの技術をクラウドサービスとして提供 手軽に
  • 18. 「大量に」を支える データスペース 「データベース」から「デー タスペース」への進化が必要 これから 構造化データ、非構造化データの双方をカバー データスペース 構造化データ 非構造化データ 基幹系 情報系 データ データ テキスト 静止画 動画 音声 RDB DWH 検索システム データベース データの種類毎に、異なるシステムで管理 これまで していた
  • 19. 「深く」を特徴付ける 機械学習 最近のデータマイニングで よく使われるようになった手法 教師付き機械学習 教師無し機械学習 (応用例)異常検知 ベイジアンフィルター (応用例)高度なクラスタリング (応用例)迷惑メール判定 協調フィルタリング (応用例)レコメンデーション 従来のデータマイニングで 主に使われていた分析手法 複雑ネットワーク (応用例)レコメンデーション 相関分析 (応用例)問題点の発見 その他の手法 (応用例)信用リスク評価 回帰分析 テキスト分類 (応用例)需要予測 画像認識 クラスタリング (応用例)顧客の分類
  • 20. ポイントは自動化 ●従来のAI:人間がデータを学習してモデル化 ●ビッグデータ時代のアプリケーション 学習 モデル化 学習 モデル化 ビッグ データ データ 人間 モデル コンピュータ モデル ●従来のBI:人間がBIレポートを見ながら判断 モデル 人間 可視化 判断 コンピュータ 判断 イベント アクション イベント アクション BI マッチング レポート パターン 認識 パターン
  • 21. 応用パターン 異変を察知する マーケティング セキュリティ 環境保全 ?突発的な流行の検出 ?サイバー攻撃の検出 ?河川の水質汚染、大気汚染 ?人気検索ワードの検出 の兆候を検出撃を発見 医療/介護 コンプライアンス 通信事業 ?新生児の体調不良を検出 ?インサイダー取引など不 ?サービスレベル低下の検出 ?独居老人の見守り 正行為の検出 ?通信機器故障の予測 製造業 システム運用 金融業 ?完成品の不具合の検出 ?サーバーやパーツの故障 ?クレジットカードの不正利 ?製造装置の故障予測 予測 用の検出
  • 22. 応用パターン 異変を察知する ●様々なログから「社員の不正」を検出 総務部 情報の所轄部署 情報システム部 人事部 業務アプリ 業務アプリ ケーション ケーション 顧客DB 人事DB ビルの ネットワーク 入退館システム 組織の垣根を越えて情報を収集 ArcSight 「退職2週間前の社員Aが、休日にオフィスに入り、 CRM(顧客関係管理システム)にアクセス。顧客 データを抜き出した」→不正検出!
  • 23. 応用パターン 近未来を予測する ●サイバーエージェントによる「退会を予測する」取り組み ①ユーザーの行動履歴を分析 ②Webサーバーのログデー ③何らかの「特典」などを付 して、「退会」につながりそ タをリアルタイムに分析して、 与して、ユーザーに退会を思 うな行動の予兆を見つけ出す ユーザーの「退会しそうな兆 い留まらせる 候」を見つけ出す ☆ → ● → △ → ■ → 退会 Webサーバー ログデータ 特典 ● → △ → ■ → ☆ → 退会 会員 リアルタイム × → ● → △ → ◇ → 退会 Hadoop □ → ☆ → ● → △ → 退会 ●→△
  • 24. 応用パターン 近未来を予測する ●フォードのPHV向けカーナビ ②データからユー カーナビの画面 ザーの走行パターン を分析 Google Storage パターン データ Prediction API ①自動車の走 行履歴を蓄積 ③時刻や場所 情報を伝達 ④時刻や場所情報 から目的地を予測。 最適ルートや燃費 パターンを予測 ⑤排気ガスの発生が規 制された「グリーン ゾーン」での走行が予 想される場合は、バッ テリーを節約する フォードのプラグインハイブリッド(PHV)カー API:アプリケーション?プログラミング?インターフェース
  • 25. 応用パターン 今を描き出す ●マイニングブラウニーの「MitsuBachi」 Webサイト、ブログ ●競合はどうしている? メディアサイトに掲載されてい インター る広告バナーのサイズや掲載数 ネット などから競合企業が支払ってい る広告費用を推定 ●経済活動はどうなっている? ソーシャルネット 不動産情報サイトに掲載されて ワークサイト いる物件情報を分析すれば、ど の地域で再開発が始まったか分 かる。再開発地域では、築年数 の古い物件が減り始めるから
  • 27. 大手ベンダーが こぞってHadoop関連の取り組み 会社名 時期 主な施策 米EMC 2010年7月 DWH「Greenplum」のベンダー、米グリーンプラムを買収 2011年4月 ネットワークパケット解析ツール「NetWitness」のベンダー、米ネットウィットネスを買収 2011年下期 Hadoopディストリビューション「Greenplum HD」を出荷予定 2011年下期 「Greenplum」とデータマイニングソフト「SAS」を統合したアプライアンスを出荷予定 米ヒューレットパッカード 2010年9月 統合ログ監視ソフト「ArcSight」のベンダー、米アークサイトを買収 2011年2月 カラム指向DB「Vertica」のベンダー、米バーティカを買収 2011年4月 「Hadoop」専用のPCサーバーハードウエアを発売 2011年8月 検索エンジンソフト「Autonomy」のベンダー、英オートノミーに買収提案 米IBM 2009年7月 データマイニングソフト「SPSS」のベンダー、米SPSSを買収 2010年3月 ストリーミング処理ソフト「InfoSphere Streams」を出荷 2010年9月 DWH「Netezza」のベンダー、米ネティーザを買収 2011年6月 Hadoopベースのデータ分析ソフト「InfoSphere BigInsights」を発売 米マイクロソフト 2008年1月 検索エンジンソフト「FAST」のベンダー、フィンランド?サーチ&トランスファーを買収 2011年5月 並列プログラミング基盤「LINQ to HPC(開発コード名:Dryad)」を出荷 2011年末~ Windows Server、Windows Azure向けの「Hadoop」を提供予定 2012年 SQL Server次期バージョン(開発コード名Denali)に、カラム指向DB機能を搭載 米ネットアップ 2011年6月 HadoopにRAID機能を追加する「Hadoop Open Storage System」を発表 米オラクル 2011年10月 Hadoopアプライアンス「Oracle Big Data Appliance」を発表 米SAP 2010年5月 データベース/DWHベンダーの米サイベースを買収 2010年12月 インメモリーデータベース「SAP HANA」を発売 NEC 2011年内 インメモリーデータベースを発売予定 開発中 ミッションクリティカル用途に特化した「MC Hadoop」を開発中 富士通 2011年8月 ビッグデータPaaS「SPATIOWL(スペーシオウル)」を発表 開発中 ストレージ装置「ETERNUS」上で稼働するHadoopを開発中 日立製作所 2011年1月 Hadoopの導入支援サービスを開始 開発中 検索性能に特化した「アウトオブオーダー実行型データベース」を開発中 NTTデータ 開発中 機械学習アルゴリズム「K平均法」をGPGPUを使って解くプログラムを開発中
  • 29. 「Growth Team」を作ろう ? Growth Teamは、サービスの成長 (Growth)に責任を持ったエンジニア チームという意味。Dropboxが最初に始 めた取り組みで、ベイエリア界隈のス タートアップで増えている(らしい)
  • 30. 顿谤辞辫产辞虫の例 “Growth Enginner”を募集中
  • 31. 顿谤辞辫产辞虫の例 Dropbox is one of the fastest growing startups on the Internet. We want to become the way the world stores and shares files, and we're well on our way. It isn't a mystery why: users love it. But also, we've built tools which make Dropbox easy to spread. We're kicking this into overdrive by expanding the Growth Team. A growth engineer would substantially contribute to Dropbox's continued success. The process is simple: measure everything to understand it, come up with new ideas, test the best ones, launch the best performing, and repeat this all as quickly as possible. For the growth engineer, the questions become: how can we scale our analytics systems? What insights can we extract from our wealth of data to inspire the more incisive ideas? What tools can we build to run tests with dexterity?
  • 32. 顿谤辞辫产辞虫の例 Role & Responsibilities: ?Gather and process data from the Dropbox production servers ?Scale our MySQL analytics databases ?Measuring growth, usage rates of various Dropbox features, overall activity levels, cost, revenue, and much, much more ?Build and maintain web interfaces and dashboards to display Dropbox metrics ?Analyze user data to help determine what kinds of improvements Dropbox should make ?Work with the Dropbox web, mobile, and client teams to run experiments on their respective platforms ?Code in Python, HTML, Javascript, CSS, and possibly also C++ ?Continuously improve the quality of the analytics code base
  • 33. 顿谤辞辫产辞虫の例 Requirements: ?Bachelor's degree in Computer Science. ?Math doesn't intimidate you ?Unix/Linux proficiency ?SQL proficiency ?Writing high quality, easy to understand code is important to you for practical reasons, but also a little bit "just because". ?You're obsessive about correctness and edge cases, but at the same time understand when to make sacrifices for practical reasons ?A desire to go the extra mile and hold your projects to a higher standard - you're the biggest critic of anything you do and have an appetite for solving problems and making things better ?Good product sense - you can see things from both the growth/engineering and the general Dropbox user's standpoint
  • 34. 顿谤辞辫产辞虫の例 Nice-to-Have's: ?Startup experience ?Proficient in Python ?Proficient with HTML/CSS/Javascript ?Proficient in C++ ?Experience with managing servers / sysadmin experience ?DBAdmin experience ?Experience with distributed version control systems (Mercurial, Git). ?Strong mathematical and statistical background
  • 35. おしまい ありがとう ございました