狠狠撸
Submit Search
おそらく世界一コンパクトで実用的なAI入門
?
2 likes
?
434 views
K
Kenshi Toritani
Follow
5/29セミナーの资料です
Read less
Read more
1 of 59
Download now
Downloaded 12 times
More Related Content
おそらく世界一コンパクトで実用的なAI入門
1.
おそらく 世界?コンパクトで 実?的なAI?? 【特別無償講座】 Kenshi Toritani 1
2.
??健史 1963年 広島?まれ 1989年 ?本アイ?ビー
?エム 2018年 フリーのITコンサルタント IBMでシステムエンジニアとして29年間の勤務を経て独?、現在フリーのITコンサル タントとして活動中。 技術コミュニティー「ゼロから始める機械学習」主宰、企業へ のコンサルティング、?材育成、技術セミナー、技術記事執筆などの活動を?う。 ネットニュース「ハーバービジネスオンライン」 : https://hbol.jp/hbo_comment_people/??健史 ブログ「越境するコンピューター」 : http://blogs.itmedia.co.jp/toritani/ コミュニティ「 ゼロから始める機械学習」 :https://www.facebook.com/groups/151075008918694/ ??紹介 ハーバービジネスオンライン アクセスランキング1位獲得 2
3.
今?の内容 AIの概要を短時間で理解する 時間 内容 19:30 -
20:20 【第1部】 AIとは何か? みんなが知っておくべき勘所 ~そもそもAIとは? / AIの活?分野 / AIの話が分かりにくい意外な理由とは? 20:20 - 20:30 Q&A 休憩 20:30 - 21:00 【第2部】 AIとは何か? 技術者が知っておくべき勘所 ~AIを?えるテクノロジー 機械学習概要 / スキルアップの勘所~ 21:00 - 21:10 QA クロージング 3
4.
第三次AIブーム 4
5.
第三次AIブーム 第1次ブーム 第2次ブーム 第3次ブーム 知的なコンピューターへの期待
エキスパートシステム データから学習 5
6.
AIブームを牽引するテクノロジー ディープラーニング ? 機械学習の?法の?つ、従来の?法を凌駕する精度を実現 ? ベンチマークでトップの成績
?声認識、物体認識 ? 囲碁チャンピオンに勝利 AlphaGo ? 機械翻訳の劇的精度向上 Google翻訳 6
7.
AIへの誤解 SFと現実の混同 著名?の?解への盲信 7
8.
AIを?えるテクノロジー 機械学習とは AIと機械学習とディープラーニングの関係 8
9.
機械学習とは何か? 現在のAIを?えているテクノロジー ? 従来型と異なるコンピューターの使い? (ハードは同じ) 従来型
: 演繹 プログラムが重要 機械学習 : 帰納 与えるデータが重要 画像認識 カード不正三?形の?積 やり?を説明できる、常に正しい答え やり?を説明できない、おそらく?体正しい答え 9 ?さ
10.
機械学習に出来ること 出来ることはとてもシンプルです 回帰 分類 クラスター 今年のデータから 来年の売り上げ予測 過去のカードデータから 不正使?を検知 購買履歴から 顧客をセグメント分け 次元削減 2次元データ(体重/??) をBMI(1次元)に ???
= 体重(??) ??(??) + 10
11.
AIすごい!という結果も要するに分類 ? 囲碁名?に勝利 (AlphaGo) ?
19 x 19の囲碁盤のどこに置くのが最適か?という分類 ? クイズ王に勝利 (Watson) ? どの単語が?番答えの確率が?いか?という分類 11
12.
機械学習の?々 ?々な実装があります 機械学習 Neural Network Deep Learning Support Vector Machine Decision Tree K-Means K-NN Na?ve Bayes etc… 12
13.
なぜ今? 理論は昔からあり、実装に必要な2つの条件が整った データ 性能 13
14.
AI活?事例 画像 / ?然?語
/ データに潜むパターン 14
15.
画像 中古?販売 写真から中古?の?種、年代を選別 農業 画像解析し病害発?箇所を検出 製造
ラインの動画から不良品を検出 医療 レントゲン画像から病巣を検知 畜産 豚の画像から体重を推測 スマホ 顔認証 15
16.
?然?語 機械翻訳 ?本語を英語に翻訳 ?書分類 記事をジャンル分け ?書要約
?い?書を短く要約 質問応答 ?葉を使った質問に答える 対話 チャットボット、Siri 16
17.
データに潜むパターンを発? カード不正検知 不正利?を検知 退職予備軍検知 離職の兆候を検知 ?動?保険
危険ドライバーを検出 ?材雇? ?材を選別 !!!要注意!!! 機械学習は過去のデータを 元に傾向を出すだけ すべき、すべきでは無い への回答はしない 最終判断は?間が?う 17
18.
AI検討のポイント 18
19.
5つの質問 1. AI(機械学習)が最適なのか? 2. データはありますか? 3.
間違いを許容できますか? 4. 万能の神ではありません 5. そもそも何がしたいのか? 19
20.
AI(機械学習)が最適なのか? 適材適所 ? 演繹的な従来の?法でできるなら、そちらの?がいい 20
21.
データはありますか? ガーベージインガーベージアウト ? そのデータで適切な予測ができるか? ? 過去と違う未来は予測できません ?
?分な量のデータがあるか? 21
22.
間違いを許容できますか? 100%の精度を期待しない ? 「?逃し」と「誤検知」を補完する仕組み ? ?間とは違う間違いの可能性を考慮に 22
23.
意思決定の要素 万能の神ではありません 機械学習は意思決定の?部を?援するだけ ? 与えられた”ルール”と”選択肢”から”過去の選択”と似たものを推測 ? :
想定外の選択肢 ? : 選好を変える 選択候補 選好 > > 信念 開けるのは ?つだけ 機械学習が?援出来る部分 制約 どこにオレンジ ?ってる? 23
24.
そもそも何がしたいのですか? 24
25.
AI時代に求められる 技術者になるには 25
26.
機械学習が要求するスキルチェンジ 新しい?的?考え?に必要な新しいスキルセット 従来 AI ?的 (主に)?産性向上
(主に)意思決定?援 考え? 演繹的思考 帰納的思考 スキル 蓄積 新規 26
27.
必要なスキルセット 機械学習だけじゃもったいない データサイエンス 機械学習 統計学 意思決定理論 Deep Learning 数学 個? 集団 27
28.
IT技術者のチャンス AIで新たなスキルセットが必要なら?につければいい 理系出?者 ?系出?者 Analytics担当 年齢は関係ないです 28
29.
スキル習得への道 ~純粋?系のエンジニアがスキル習得するには?~ 29
30.
必要な スキルセット 機械学習 統計学 意思決定理論 数学 微分?積分 線形代数 30
31.
スキル習得のポイント 最初のハードルを超える 市販本 研修 コミュニティー 31
32.
最初のハードルを越える 市販本でどこまでいけるか 統計学, 数学(線形代数, 微分?積分) ?
おすすめ、(好みに合えば) ?系でも独学でいけます 32
33.
最初のハードルを越える 市販本でどこまでいけるか 機械学習 ? とてもいい本ですが、?系?がゼロからはじめるにはかなり?太 33
34.
最初のハードルを越える 市販本でどこまでいけるか 意思決定理論 おすすめ ?系でも独学でいけます ?太 考え??表現に慣れるまで?変 34
35.
最初のハードル 研修?コミュニティー 最初のハードルを越えるための王道 ? coursera,
Udemy, etc… ? ゼロからはじめる機械学習 ? 技術者向けのプライベートコミュニティー 35
36.
機械学習の仕組み ~ゼロからはじめる機械学習セミナーより~ 過去に実施した下記セミナーの内容を元に作成したサマリーです - ゼロから始める機械学習 ディープラーニング超概要 -
ゼロから始める機械学習 機械学習と意思決定 - ゼロから始める機械学習 機械学習のための確率?統計 36
37.
機械学習とは? 機械学習とは、データに潜む規則や構造を抽出することにより、 未知の現象に対する予測やそれに基づく判断を?うための計算技 術の総称である。 ? 須?敦志 (2017)『ベイズ推論による機械学習??』講談社
p1 37
38.
機械学習のステップ 4つのステップ データ準備 学習 テスト
本番予測 38
39.
データ準備 ??はベクトル 数字を並べたもの 39
40.
ベクトル=数字を並べたもの 桜の花のデータを元にソメイヨシノと?重桜を分類する ? やりたいこと :
“額の?さ”,”花びらの?さ”を使って桜の種類を判別 ? 使?データ : 100件の桜のデータ (1-50:ソメイヨシノ/51-100:ヤエザクラ) 特徴量 教師データ ソメイヨシノヤエザクラ 注:機械学習でよく使われるIRISのデータを?本?に馴染み深い桜に変更して説明しています 分類に使うデータ(特徴量) : 2つ ?次元ベクトル (5.1, 1.4) (4.9, 1.4) (6.4, 3.5) (6.5, 3.6) Excel?に表現すると 40
41.
参考 画像は? ピクセル情報を数値で表したものを??にする (255,255, … ,
67,23, … , 128 … , 255) 画像情報を784(28 x 28) 次元のベクトルに変換 41
42.
参考 ?然?語は? ??単位は単語 ? ?書を単語に分割し、単語単位の??とするのが?般的です。 ? 形態素解析
(?本語だとMeCabが代表的) 単語の数値表現 ? 単語を数値情報に変換 ? One Hotベクトル ? 語彙数分のベクトルで表現 (該当の単語の要素だけ1、他は0なのでOne Hot) ? 分散表現 ? 単語を固定?のベクトルで表現する One Hotベクトル 今?' → 1 (1,0,0,0,0) 'は' → 2 (0,1,0,0,0) 'いい' → 3 (0,0,1,0,0) '天気' → 4 (0,0,0,1,0) 'です' → 5 (0,0,0,0,1) Question : なぜ通し番号を使わないのか? Answer : 単語に??は無いのに通し番号で??すると単語に??あるとして 学習されてしまう。 42
43.
学習 43
44.
学習とは 線を引くこと 44萼の?さ 花びらの?さ この線 出典:Python Machine
Learning 2nd Edition Sebastian Raschka 2017 Packet Publishing ヤエザクラ +1 ソメイヨシノ -1 ヤエザクラ ソメイヨシノ ボリューム調整して
45.
学習とは データをもとに線を微調整 ? 複数のボリュームを調整 ?
学習データを元に調整を?う 最初は適当な位置から データを元に微調整を繰り返し 最終的に分類線が出来る 調整 調整 調整 45 出典:Python Machine Learning 2nd Edition Sebastian Raschka 2017 Packet Publishing
46.
そんなの誰でもできるんじゃ? 分類の線引きくらい、誰でもできるんじゃないですか? ? 質問 ? 分類は要するに適切な分類線を引くのが?的と理解しました。機械学 習なんて?層なもの持ち出さなくても線くらい引けます。 ?
回答 ? イメージしやすいように多くの??書では2次元の特徴量で説明してい ますが、これが多次元になるとどう線を引くか(多次元では超平?と ?います)直感的に把握することは不可能です。 ? 多次元になった場合も今回説明した2次元と同じ?法が使えるという とこがありがたいのです。 46
47.
参考 直線で分けれないものもあるでしょ? 線形分離不可に対応出来ない ? パーセプトロンの限界 ? 曲線を分離不可とミンスキーが指摘、ブーム下?の要因 直線分割できるように変換 47
48.
参考 線形分離不可への対応 ? 線形分離不可(直線で分割できない)って? 0 1 0 1 0 1 0
1 こちらはオッケー! こっちは無理 48
49.
参考 線形分離不可への対応 ? 線形分離可能な変化を?う ? ??前に?う ?
機械学習の中間層で?う ディープラーニングはこれできる 0 1 0 1 49 0 1 0 1 49 変換 2
50.
参考 分類 ?多層構造の利点? 単相では線形分離不可能なものも分離可能 ? 隠れ層で線形分離可能な形式に変換 隠れ層??層
出?層 5? 0 1 1 Σ ???? Σ ???? ?1 1 1 1 ?2 Σ ??? ?B ?C ?+ 0 0 0 1 1 0 1 1 0 0 1 0 1 0 2 1 0 1 1 0 × ? ? × 0 1 0 1 × × ? ? 0 1 0 1 × × ?? 2 線形分離不可 隠れ層で変換 (?線形) 線形分離可能 教師データ 特徴量 表現学習 50 Ian Goodfellow, Deep Learning (The MIT Press,2016) p166~171を元に作成 線形出?を持つ2層ネットワークは、?分な数の隠れユニットがあ れば、コンパクトな定義域を持つどんな連続関数でも、任意の精度 で?様に近似できる。 C.M.ビショップ「パターン認識と機械学習 上」丸善出版 2012 p231
51.
テスト 51
52.
過学習していないか 本番環境でも性能を発揮するか? ? 学習データに過剰適合していると、本番データで精度が落ちる 学習に使わなかったデータでチェックする出典:Python Machine
Learning 2nd Edition Sebastian Raschka 2017 Packet Publishing 52
53.
どちらが重要? 要件を満たす性能が出ているか? ? おそらくだいたい正しい、許容される間違いの種類とレベル Confusion Matrix 判定結果 + - 正解 +
True Positive ?落とし - 偽陽性 False Negative Confusion Matrix 判定結果 + - 正解 + True Positive ?落とし - 偽陽性 False Negative 検診 ドーピング 53
54.
本番予測 54 “額の?さ”,”花びらの?さ”
55.
?々な学習?法 ?きく分けて3つの?法に分類できます ? 教師あり学習 ? 回帰
(例:今年のデータから来年の売り上げ予測) ? 分類 (例:過去のカードデータから不正使?を検知) ? 教師なし学習 ? クラスター (例:購買履歴を元に顧客をセグメント分け) ? 次元削減 (例:3次元の?体を2次元の写真に) ? 強化学習 最終結果を元にフィードバック 今桜で説明したのはこちら
56.
クロージング 56
57.
今後の活動予定 6? 越境するテクノロジー本格始動 ? 「ゼロからはじめる機械学習」 ?
セミナー ? “(仮)システムエンジニアのためのAIの始め?” 6?末 ? コミュニティー (準備中) ? 「ゼロからはじめるブロックチェーン」 ? セミナー ? “(仮)ブロックチェーン超??” ? コミュニティー (計画中) 57
58.
こちらに登録ください Facebookグループ ?ゼロからはじめる機械学習 ? https://www.facebook.com/groups/151075008918694/ 58
59.
ご静聴ありがとうございました! kenshi.18@gmail.com 59
Download