狠狠撸

狠狠撸Share a Scribd company logo
R ?& ?Machine ?Leaning
July ?6 ?2015
Yoshiharu	
 ?Ikutani	
 ?
@	
 ?NNCT	
 ?勉強会	
 ?
今回の?目標
l?? 「機械学習とは何か」を理理解する
l?? Rの初歩を理理解する
l?? Rで基本的な機械学習プログラムを実?行行する
参考① 参考②
2	
R	
 ?&	
 ?Machine	
 ?Leaning
アジェンダ
l?? 機械学習って何?
l?? Rって何? ?どうやって使う?
l?? 実習:Rで機械学習アルゴリズム
3	
R	
 ?&	
 ?Machine	
 ?Leaning
機械学習とは?
l?? まず質問します
「機械学習って何ですか?」
※さらさら答えられる?人は帰って良良し
l?? 分からないなら偉い?人に聞きましょう
l?? Tom ?Mitchell
カーネギーメロン?大学教授
?人?工知能?機械学習の権威
4	
R	
 ?&	
 ?Machine	
 ?Leaning
Tom ?Mitchell ?による定義
“機械学習では経験により?自動的に改善する
プログラムをどう作るかという問題を考える”
プログラム 経験 改善(学習)
このプロセスを?自動でやるにはどうすれば良良い?
5	
R	
 ?&	
 ?Machine	
 ?Leaning
Tom ?Mitchell ?による詳細な定義
“プログラムはタスクTとパフォーマンス
 ?測定Pに関連する経験Eから学習する”
株価チャート
(経験E)
売買結果
(パフォーマンス測定P)
判断
(タスクT)
買い
売り
6	
R	
 ?&	
 ?Machine	
 ?Leaning
Tom ?Mitchell ?による詳細な定義
“タスクTでパフォーマンスした場合
 ?パフォーマンス測定Pにより評価され
 ?経験Eにより改善されていく”
経験E パフォーマンス測定PタスクT
判断
プログラムの改善
7	
R	
 ?&	
 ?Machine	
 ?Leaning
けっきょく機械学習とは?
“パフォーマンス測定Pに対する
 ?判断(タスクT)を?一般化するため
 ?データ(経験E)からモデルを訓練すること“
経験E パフォーマンス測定PタスクT
判断
モデルの改善
モデル
8	
R	
 ?&	
 ?Machine	
 ?Leaning
機械学習ができると何が嬉しいの?
l?? 過去のデータから
未来の現象を予測できる
l?? もうすこし厳密に?言うと???
過去のデータによるモデルの訓練から
未来の現象への適した判断を予測できる
未知の経験 ?高パフォーマンス
最適な
判断
訓練された
モデル
9	
R	
 ?&	
 ?Machine	
 ?Leaning
機械学習で解ける問題
l?? 代表的な問題は以下の4つ
1.? Classi?cation ?(分類)
2.? Regression ?(回帰)
3.? Clustering ?(基準なし分類)
4.? Rule ?Extraction ?(ルール抽出)
l?? 発表の?目的範囲を超えるので説明は割愛
※各?自,上のキーワードで調べてみてください
10	
R	
 ?&	
 ?Machine	
 ?Leaning
アジェンダ
l?? 機械学習って何?
l?? Rって何? ?どうやって使う?
l?? 実習:Rで機械学習アルゴリズム
11	
R	
 ?&	
 ?Machine	
 ?Leaning
Rとは?
l?? オープンソース&フリーの
統計解析向けプログラミング?言語
l?? (私?見見では)データいじり特化型?言語
R	
 ?&	
 ?Machine	
 ?Leaning	
 12	
読書き?操作
グラフ出?力力が容易易
(だいたい1?行行)
膨?大な数の解析?手法
がパッケージで提供
データ操作以外苦?手
(Text処理理すら微妙)
ベクトルベースの
変わった処理理体系
とりあえず触ってみる
l?? 準備
1.? Rのインストール
http://cran.r-‐??project.org/bin/macosx/ ?
2.? Rstuidoのインストール
http://www.rstudio.com/products/rstudio/ ?
3.? GitHubレポジトリのクローン
https://github.com/Yoshiharu-‐??Ikutani/R_?machine ?
R	
 ?&	
 ?Machine	
 ?Leaning	
 13
CSV ?の読込と表?示
l?? CSVを読み込む
R	
 ?&	
 ?Machine	
 ?Leaning	
 14	
>	
 ?data	
 ?<-?‐	
 ?read.csv("data_pca.csv")	
 ?
l?? data ?の中?身を表?示する
>	
 ?data	
 ?
l?? WorkingDirectoryをR_?machineに設定
Rstudio上で Ctrl+ShiG+H	
 ?
data ?の部分表?示
l?? data ?の1列列?目を表?示
R	
 ?&	
 ?Machine	
 ?Leaning	
 15	
>	
 ?data[,1]	
 ?
l?? data ?の1-‐??3?行行?目の2-‐??3列列?目を表?示
>	
 ?data[1:3,2:3]	
 ?
l?? data ?の1?行行?目を表?示
>	
 ?data[1,]	
 ?
data ?のグラフ出?力力
l?? dataの列列ごとの分布を箱ヒゲ図で出?力力
R	
 ?&	
 ?Machine	
 ?Leaning	
 16	
>	
 ?boxplot(data)	
 ?
l?? dataの3列列?目を線グラフで出?力力
>	
 ?plot(data[,3],type=“l”)	
 ?
l?? dataの1列列?目を棒グラフで出?力力
>	
 ?barplot(data[,1])	
 ?
R ?まとめ
l?? データ処理理なら簡単に何でもできる
n?? 統計的検定,信号処理理 ?etc.
l?? 競合としてはPythonが熱い
n?? Scipy, ?Numpyでの数学処理理
n?? Pandasによるデータフレーム
n?? 分析以外もできる ?(Rより上?)
R	
 ?&	
 ?Machine	
 ?Leaning	
 17	
vs
アジェンダ
l?? 機械学習って何?
l?? Rって何? ?どうやって使う?
l?? 実習:Rで機械学習アルゴリズム
18	
R	
 ?&	
 ?Machine	
 ?Leaning
Rで機械学習アルゴリズム
l?? できそうな気がしてきましたか?
l?? 基本は以下のフロー通り
今?日は特にRを使うところだけ実習
R	
 ?&	
 ?Machine	
 ?Leaning	
 19	
データの
収集
データの
読込?整形
機械学習
の実?行行
取り上げる機械学習
l?? 4種類のアルゴリズムのRコードを?用意
1.? ニューラルネット ?(NeuralNetwork.R)
2.? 線形回帰 ?(LinerRegression.R)
3.? k-‐??means法 ?(kmeans.R)
4.? 主成分分析 ?(PCA.R)
l?? 今回はニューラルネットだけ解説
※残りは?自由に試してください
R	
 ?&	
 ?Machine	
 ?Leaning	
 20
問題設定
l?? アヤメ(花の?一種)の"がく"と"花びら"の
情報から品種を推測したい
l?? irisにはアヤメの情報が格納
n?? Sepal.Length ?& ?Width ?: ?がくの??長さ?幅
n?? Petal.Length ?& ?Width ?: ?花びらの??長さ?幅
n?? Species ?: ?品種
R	
 ?&	
 ?Machine	
 ?Leaning	
 21
ニューラルネットワーク
l?? 問題解決のためニューラルネットを利利?用
n?? 原理理についての説明は割愛
R	
 ?&	
 ?Machine	
 ?Leaning	
 22	
Sepal.Length
Sepal.Width
Petal.Length
Petal.Width
品種A
品種B
品種C
学習条件の整理理
l?? irisには150個のデータが格納
n?? 75個のデータを訓練?用 ?(iris.train)
n?? 残り75個のデータをテスト?用 ?(iris.test)
R	
 ?&	
 ?Machine	
 ?Leaning	
 23	
経験E パフォーマンス測定PタスクT
品種
判断
モデルの改善
モデル
実際に試してみる
l?? NeuralNetwork.Rを動作させ結果を確認
R	
 ?&	
 ?Machine	
 ?Leaning	
 24
まとめ
l?? 機械学習は4つの要素から構成
1.? 経験E:アヤメの情報
2.? タスクT:品種の判断
3.? パフォーマンス測定P:判断の正否
4.? ?自動で改善可能なモデル:ニューラルネット
l?? 機械学習とは:
“未来の現象への適した判断を予測するための
過去のデータを使ったモデルの訓練”
R	
 ?&	
 ?Machine	
 ?Leaning	
 25

More Related Content

Similar to R & Machine Leaning (14)

5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習
__john_smith__
?
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
?
碍笔罢の基本と、その活用法
碍笔罢の基本と、その活用法碍笔罢の基本と、その活用法
碍笔罢の基本と、その活用法
ESM SEC
?
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
KIT Cognitive Interaction Design
?
アジャイル开発へのイテレーション?ゼロ
アジャイル开発へのイテレーション?ゼロアジャイル开発へのイテレーション?ゼロ
アジャイル开発へのイテレーション?ゼロ
Taisuke Shiratori
?
人工知能ハンズオン
人工知能ハンズオン人工知能ハンズオン
人工知能ハンズオン
yaju88
?
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
Rakuten Group, Inc.
?
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
Shunsuke Nakamura
?
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
Shunsuke Nakamura
?
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
Shunsuke Nakamura
?
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
Shunsuke Nakamura
?
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
Hiroaki Kudo
?
Machine learning
Machine learningMachine learning
Machine learning
hiroyukikageyama2
?
5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習
__john_smith__
?
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
?
碍笔罢の基本と、その活用法
碍笔罢の基本と、その活用法碍笔罢の基本と、その活用法
碍笔罢の基本と、その活用法
ESM SEC
?
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
人工知能技术の现状-今后の见通し-社会へのインパクト-冈夏树
KIT Cognitive Interaction Design
?
アジャイル开発へのイテレーション?ゼロ
アジャイル开発へのイテレーション?ゼロアジャイル开発へのイテレーション?ゼロ
アジャイル开発へのイテレーション?ゼロ
Taisuke Shiratori
?
人工知能ハンズオン
人工知能ハンズオン人工知能ハンズオン
人工知能ハンズオン
yaju88
?
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
Rakuten Group, Inc.
?
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
20180920_【ヒカ☆ラボ】【データサイエンティストが教える 】 機械学習、人工知能を使った「ビジネスになる」アプリケーションの作り方
Shunsuke Nakamura
?
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
Shunsuke Nakamura
?
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
Shunsuke Nakamura
?
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
20180925冲【サポーターズ颁辞尝补产勉强会】【営业から运用まで】データサイエンティストという职业
Shunsuke Nakamura
?
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
機械学習のマイクロサーヒ?スて?の運用の実験について #mlops
Hiroaki Kudo
?

R & Machine Leaning