狠狠撸

狠狠撸Share a Scribd company logo
<#>
はじめての
TOKYO.R #48
簑田 高志
目次
1. 自己紹介
2. ご绍介
3. 変更点
4. はじめてのR
i. インストール
ii. 起动と终了
iii. デモ(demo())
iv. データアクセス方法
v. 変数追加
vi. データ集計
vii. 関数
viii.パッケージ
5. 次のステップ
6. まとめ
※ スクリーンショットや機能等はMac版となります。
? 名前 :簑田 高志
? Twitter :aad34210
? ブログ :http://pracmper.blogspot.com/
? 出身地 :熊本県
? 出身学部 :法学部
? 仕事 :E-commerceのアナリスト
インターネット広告のビジネスアナリスト
自己紹介
ご绍介
本を共同翻訳しました
6月30日(火)発売です!
書籍の内容
?翻訳者より
?目次
?はじめに
?まえがき
?謝辞
1章 Rを手に入れる
1.1 Rのダウンロード
1.2 Rのバージョン
1.3 32bitと64bit
1.4 インストール
1.5 Revolution R Community Edition
1.6 まとめ
2章 Rの環境
2.1 コマンドラインインターフェイス(CLI)
2.2 RStudio
2.3 Revolution Analytics RPE
(R Productivity Environment)
2.4 まとめ
3章 Rパッケージ
3.1 インストールパッケージ
3.2 ロードパッケージ
3.3 パッケージの作成
3.4 まとめ
4章 Rの基本
4.1 基本的な数学
4.2 変数
4.3 データ型
4.4 ベクトル
4.5 関数(Function)の呼び出し
4.6 関数ドキュメント
4.7 欠損値
4.8 まとめ
5章 高度なデータ構造
5.1 データフレーム(data.frame)
5.2 リスト(List)
5.3 マトリックス(Matrix)
5.4 アレイ(Array)
5.5 まとめ
6章 Rへのデータ取り込み
6.1 CSVの読み込み
6.2 Excelの読み込み
6.3 データベースからの読み込み
6.4 他社統計ツールからの読み込み
6.5 Rバイナリファイル
6.6 Rに入っているデータ
6.7 Webサイトからの抽出
6.8 まとめ
7章 統計的なグラフィクス
7.1 基本グラフィクス
7.2 ggplot2
7.3 まとめ
8章 Rの関数を書く
8.1 ハロー、ワールド!
8.2 関数の引数
8.3 値の返却
8.4 do.call
8.5 まとめ
9章 制御文
9.1 ifとelse
9.2 Switch
9.3 ifelse
9.4 複合テスト
9.5 まとめ
10章 ループ:Rの方法ではない反復方法
10.1 forループ
10.2 whileループ
10.3 ループの制御
10.4 まとめ
11章 グループピング操作
11.1 Applyファミリー
11.2 aggregate
11.3 plyr
11.4 data.table
11.5 まとめ
12章 データ整形
12.1 cbindとrbind
12.2 Join
12.3 reshape2
12.4 まとめ
13章 文字列操作
13.1 paste
13.2 sprintf
13.3 テキストの抽出
13.4 正規表現
13.5 まとめ
14章 確率分布
14.1 正規分布
14.2 二項分布
14.3 ポアソン分布
14.4 その他の分布
14.5 まとめ
15章 基本統計
15.1 要約統計
15.2 相関と共分散
15.3 t検定
15.4 分散分析
15.5 まとめ
16章 線形モデル
16.1 単回帰
16.2 重回帰
16.3 まとめ
17章 一般化線形モデル
17.1 ロジスティック回帰
17.2 ポアソン回帰
17.3 その他の一般化線形モデル
17.4 生存時間分析
17.5 まとめ
18章 モデル評価
18.1 残差
18.2 モデル比較
18.3 クロスバリデーション
18.4 ブートストラップ
18.5 ステップワイズ変数選択法
18.6 まとめ
19章 正則化と縮小
19.1 Elastic Net
19.2 Bayesian shrinkage
19.3 まとめ
20章 非線形モデル
20.1 非線形最小二乗法
20.2 スプライン
20.3 一般化加法モデル
20.4 決定木
20.5 ランダムフォレスト
20.6 まとめ
21章 時系列と自己相関
21.1 自己回帰移動平均
21.2 VAR
21.3 GARCH
21.4 まとめ
22章 クラスタリング
22.1 K-means
22.2 PAM
22.3 階層型クラスタリング
22.4 まとめ
23章 knitrパッケージによる再現性?レポートとスライドショー
23.1 Latexプログラムのインストール
23.2 Latex 入門
23.3 Latexを使ったknitr
23.4 マークダウンのヒント
23.5 knitrとマークダウンの利用
23.6 Pandoc
23.7 まとめ
24章 Rパッケージの構築
24.1 フォルダ構成
24.2 パッケージファイル
24.3 パッケージドキュメンテーション
24.4 チェック、構築とインストール
24.5 CRANへの登録
24.6 C++コード
24.7 まとめ
付録A 情報リソース
A.1 Meetup
A.2 Stack Overflow
A.3 Twitter
A.4 カンファレンス
A.5 Webサイト
A.6 ドキュメント
A.7 書籍
A.8 まとめ
付録B 用語集 / 索引
1章?24章+α
全448ページ
書籍の内容
? 特徴
? Rをはじめたばかりの人から、Rを使って解析に挑戦し
てみたい人、データ分析ってどういう事ができるのだろ
うか?ということを知りたい人に最適。
? もともとはコロンビア大学の統計学の教授のJared.P.
Landarさんが自分が大学院時代に教えてもらいた
かった内容がベース。
? ゼミ生も実験台に…
? Rでできることを「俯瞰」して見ることができる。
本を共同翻訳しました
よろしくおねがいします。
変更点
はじめてのRはいつが「はじめて?」
「はじめてのR」を最初に作成 ? もう5年前!
いろいろ変わりました
この5年の間にRも大きな進歩
■パッケージの進化 ■外部環境の変化
■開発環境の進化
? apply , aggregate ? dplyr
? plot ? ggplot2
? --- ? shiny , googlevis , rCharts
…
内容改定しました
「はじめてのR」も改定。
変更点 これまで これから
環境 Rコンソール RStudio
データの集計方法 apply , aggregate dplyr
パッケージインストー
ル
install.packages()
Rstudio
>パッケージタブ
はじめての
インストール
インストール
インストール:Rstudioをインストール
特に問題がなければ、Desktopを選択
http://www.rstudio.com/products/RStudio/
インストール
インストール:Rstudioをインストール
特に問題がなければ、Desktopを選択
http://www.rstudio.com/products/RStudio/
インストール
ダウンロードファイルをダブルクリックして起動。
Macの場合、アイコンをApplicationsにドラッグアンドドロップ
起动と终了
起动と终了
Macの場合、アイコンをApplicationsフォルダにRstudioのアイコンが入っている
Rstudio.appのみダブルクリックして起動。(R.appは起動しなくてもよいです)
起动と终了
Macの場合、アイコンをApplicationsフォルダにRstudioのアイコンが入っている
Rstudio.appのみダブルクリックして起動。(R.appは起動しなくてもよいです)
起动と终了
Tools>Global Optionで背景色、文字フォント、配置を変更することが可能。
起动と终了
通常のアプリケーションと同じように終了できる。
また、コマンドラインにq()を実行しても終了可能。
デモ(诲别尘辞())
demo()
demo()という関数でパッケージの例を見ることができる。
コンソールに結果が表示されるので、Returnキーを押す
demo()
graphics関数のデモが下のPlotタブに結果が表示
データアクセス
方法
データアクセス方法
実際にデータにデータアクセスしてみましょう。
最初は「iris」というデータセット(データフレーム)から触ってみます
iris
データアクセス方法
最初の数行だけにアクセスしたい場合は、head() を使います。
引数で取り出したい行数を指定可能。(デフォルトは6)
head(iris) / head(iris,10)
データアクセス方法
最後の数行だけにアクセスしたい場合は、tail() を使います。
引数で取り出したい行数を指定可能。(デフォルトは6)
tail(iris) / tail(iris,10)
データアクセス方法
特定の項目(列、変数)にアクセスしたい場合は、いくつかの方法がある。
「$」を使った利用例: iris$Sepal.Length
データアクセス方法
特定の項目(列、変数)にアクセスしたい場合は、いくつかの方法がある。
「[(行) , (列)]」を使った利用例:iris[ 1, 1 ]
データアクセス方法
これらのアクセス方法は組合せて使うことができる
head()と$の組合せ
変数追加
変数追加
データ分析したい場合、変数を追加したい時がある。
?データフレームに<-で追加
変数追加
データ分析したい場合、変数を追加したい時がある。
?dplyr::mutateで追加
データ集計
データをまとめあげたい場合
?applyファミリーを利用
データ集計
データをまとめあげたい場合
?applyファミリーを利用
?tapply(集計データ,集計グループ,関数)
データ集計
データをまとめあげたい場合
?applyファミリーを利用
?aggregate (集計対象,集計カテゴリ,関数)
データ集計
データをまとめあげたい場合
?dplyr::summarize 関数を利用
?group_by(データ、集計対象) 、summarize(group_by , 集計変数)
関数
関数
数多くの関数がサポート対象
sum:合計、mean:平均、median:中央値、sd:標準偏差、cor:相関係数 …
R Reference Card のMathを見てみましょう。
http://cran.r-project.org/doc/contrib/Short-refcard.pdf
パッケージ
パッケージ
Rの大きな特徴。
約6,000以上のパッケージがCRANに登録。Githubのレポジトリを入れるともっと多くのパッケージが存在。
nrow(available.packages()) ? 6,665 (2015/06/20現在)
出典:http://blog.revolutionanalytics.com/2013/11/cran-now-has-5000-r-packages.html
パッケージ
利用方法は2つ
?install.packages(“[パッケージ名]”)
?Rstudioのpackageタブ
次のステップ
次のステップ
本格的にRを使う際に必要な知識を紹介
? 条件分岐
? ループ
? グラフ作成
? データベースとの接続
? 統計解析
本日のまとめ
まとめ
今日話をした内容は以下
i. インストール :Rstudioのインストール
ii. 起动と终了 :アイコンから起動、q()で終了
iii. デモ(demo()) :demo関数
iv. データアクセス方法 :複数のアクセス方法
v. 変数追加 :<- とmutate
vi. データ集計 :applyファミリ、aggregate、
summarize
vii. 関数 :チートシート見てね。
viii. パッケージ :Rの最大特徴。
install.pacagesとpackageタブ
ありがとうございました!

More Related Content

Tokyo r47 beginner