狠狠撸

狠狠撸Share a Scribd company logo
【今日ジョブチェンジ】
エンジニアからデータサイエンティストになる方法
中村牧場合同会社、株式会社Splink
中村俊輔
今日の流れ
● 何故今機械学習なのか
● 機械学習を取り巻く環境とビジネス機会の関係
● エンジニアとデータサイエンティスト
● 何が違うのか?
● データサイエンティストに必要な要素
● 最初に必要なもの
● キャリアパス
● データサイエンティストを育成してわかったこと
勉強会が終わったときにあなたは
● 今日の勉強会で…
● エンジニアからデータサイエンティストになるイメージがわかる
● まず何をしたら良いか分かる
自己紹介
● 学生時代
● 大学でアメフト部で相手チームのデータ分析
● 大学、大学院で機械学習を専攻
● 研究テーマ :機械学習によるアメリカンフットボールの戦略推定
● インターン -> 業務委託契約
○ マクロミルで1ヶ月のインターンシップの後、
半年業務委託契約
データサイエンティストとして働くことを知る
注意
● サッカー選手ではありません
データ!アメフト!
中村俊輔
@shun_naka
自己紹介
● 社会人
● 楽天でキャリアスタート
● Hadoopを使ったビッグデータ処理、Webアプリケーション開発
● 機械学習を使う機会には恵まれず
● cherry-pick入社
● 自社サービスの機械学習部分の開発
● 人工知能受託開発会社 CTO
● 受託開発の機械学習部分、
● 30プロジェクト
50人以上のデータサイエンティストの育成、マネージャ
● マネーフォワードグループ クラビス 人工知能研究所 所長
● 書類データ化アプリケーションの機械学習部分の開発、マネージャ
● エッジコンサルティング AIジョブカレ 講師
● 機械学習、深層学習講座の講師
※日本ディープラーニング協会認定講座
● 中村牧場合同会社 設立
● 機械学習のコンサル、受託開発、人材育成
● 株式会社Splink AIエバンジェリスト
● 人材育成、プロジェクトマネージャー
● 奈良クラブ CTO
● サッカーチームのテクノロジー全般、IoT, AI, スポーツデータ解析
データ!データ!
中村俊輔
@shun_naka
自己紹介
● 働き方
● フルリモート、ネオ社会人
● 個人の活動
● NFLでデータ分析屋さんになるべく
アメフトのアプリの研究開発をやってます
@京都
● 一般社団法人Japan American football Dream
の一員として活動もしてます
中村俊輔
@shun_naka
データ!とスポーツ(特にアメフト)で
面白いことをやりたい!
何故今、機械学習なのか?
機械学習を取り巻く環境とビジネス機会の関係
まずは頭の整理
● よく聞く単語ってどこにいるの?
人工知能
汎用人工知能
機械学習
クラス分類器
Deep Learning
特化型人工知能
人間の脳を
計算機で作
るぞ!
人間の知的な行動の一部
を計算機で実現したい
はじめに
● 機械学習?
● 人間が自然に行っている学習能力と同様の機能を
コンピュータで実現しようとする技術?手法 (Wikipedia)
● 1959年から存在
● 特別新しい技術ではない
はじめに
● 何故今注目されている?
● コンピュータのほうが安く
よりよく課題を解く場面が増えた
● 何故そんな場面がふえたのか
● 人間 vs コンピュータ
● 人間の得意なこと
● 曖昧さを許容
● 多様な知識を自ら学習
● コンピュータの得意なこと
● 大規模計算が正確、高速
● 不眠不休
● コンピュータの性能上昇、データ量増加
● コンピュータのほうが安く
よりよく課題を解く場面が増えた
● 今ある仕事のいくつかはコンピュータになる…
かも
● 実用例
● スパムメール検知
● カメラの顔検出 …等
機械学習がもたらす影響
● 現在進行形で産業革命が2つ起こっている
● ICT革命
● 人工知能革命
● 機械学習でビジネス課題を解決できると競争力があがる
● 機械学習を使った方が低コストでよりよく解決できる課題が多くなる
● その課題を機械学習を使って解決することで競争力があがる
エンジニアとデータサイエンティスト
何が違うのか?
そもそも
(受託開発だとして)
ほぼ同じ
そもそも
納品するもの: プログラム
基本API
違うところ
検査項目に
モデルの精度をつけない
機能レベルでの検査と
仮説がどのように
検証されたかを提出する
https://qiita.com/shunnakamu/private/37ff03aad5bfe7d23471
必要なスキルは
前提知識がすこし増える
(数学、確率、機械学習等)
その他は新しいプログラミング言語を
覚えるくらいのレベル
データサイエンティストに必要な要素
データサイエンティストに求められるスキルセット by データサイエンティスト協会
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
いろいろあるけども…
結局必要なもの:
機械学習のコードが
書けるかどうか
機械学習のコード
ただし、ピンキリ
ミニマム これができたらデータサイエンティスト
ImageNetで学習したモデルで推論してみよう
https://colab.research.google.com/drive/1DmWD4xilACIks7joVkI
s9LoZwYgcHIgS
1. PLAYGROUNDで開く
2. ドライブにコピー
3. ランタイム -> すべてのセルを実行
なんなら…
Googleのクラウドサービスに推論させてみよう
https://cloud.google.com/vision/?hl=ja
https://cloud.google.com/natural-language/?hl=ja
https://cloud.google.com/speech-to-text/?hl=ja
実際のお仕事でも使います
最初に必要なもの
パソコン、モチベーション、GPU
GPU (あれば)
キャリアパス
PC,モチベーション, GPUのあとは?
パス1
研究者パス
パス2
エンジニアパス
パス2
ビジネスパス
割合 (肌感)
割合 (今後)
何故か?
機械学習技術のコモディティ化
プログラムをちゃんと
書けることが大切に
※開発スピードの大切さ
その次は
とりあえずやってみる
やってみるって
どうするの?
どこで?
kaggleで遊んでトレーニング
どこで?
売り込んで
案件もらう
しかし…
実際売り込むのは難しい
今起きている現象
作りたい人と
作ってもらいたい人の
ミスマッチ
※何を作ればよいのか決める人が居ない
今起きている現象
真面目にデータサイエンティストを
育成する会社が少ない
今起きている現象
そんななか、真面目に育成する会社が!?
!?
中村牧場
大学、スタートアップとの
共同研究プロジェクト等
すぐやってもらえる案件、たくさんあります
さいごに 2
興味を持ってくれた人へ
やってみたい人で学生の人 : インターンっぽいのがあるのでやってみませんか
やってみたい人で働いてる人 : 副業してみませんか
やってみたい人で教えて欲しい人: 塾事業始めました。受けてください
何かデータで困っている人 : 力になります。お話を聞かせてください
社内の人材を育成したい方 : 社外向けの勉強会, 共同開発等ありますので是非ご利用ください
轮読会の様子

More Related Content

【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズ颁辞尝补产勉强会】