狠狠撸
Submit Search
巨人の勝率を上げたい (スクレイピングとデータ集計)
Jan 17, 2015
3 likes
13,527 views
Takuma Hatano
Scrape the baseball game Live-News and evaluate the game situation.
Read less
Read more
1 of 34
Download now
Download to read offline
Recommended
搁でセイバーメトリクス (イチローと松井 どっちが凄い?)
搁でセイバーメトリクス (イチローと松井 どっちが凄い?)
Takuma Hatano
?
搁でセイバーメトリクス
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
Shinichi Nakagawa
?
PyCon JP 2015 Talk Session発表資料
Rで野球のデータ解析がしたい (データが欲しい)
Rで野球のデータ解析がしたい (データが欲しい)
Takuma Hatano
?
How to obtain MLB data. By using some R packages, well-featured baseball data can be downloaded. Some examples of baseball data analysis are shown in this presentation.
経験过程
経験过程
hoxo_m
?
Watanabe理論勉強会 第七回 資料 タイトル詐欺で経験过程まで行っておらず、法則収束の説明まで
シンギュラリティを知らずに机械学习を语るな
シンギュラリティを知らずに机械学习を语るな
hoxo_m
?
Watanabe理論勉強会 第二回 発表資料
确率论基础
确率论基础
hoxo_m
?
Watanabe理論勉強会 第七回 補足資料
Rで野球データ解析がしたい ( pitchRxを使う )
Rで野球データ解析がしたい ( pitchRxを使う )
Takuma Hatano
?
Analyzing MLB data with R
颁补产辞颁丑补でバイク川崎バイク产辞迟作りました
颁补产辞颁丑补でバイク川崎バイク产辞迟作りました
Takuma Hatano
?
Application of MeCab and CaboCha.
Tokyor37
Tokyor37
TokorosawaYoshio
?
Rで部屋探し For slide share
Rで部屋探し For slide share
Shota Yasui
?
搁で部屋を探そうというお话です。
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
. .
?
2014.10.21 第11回「データ解析のための統計モデリング入門」読書会 LT
Randomforestて?高次元の変数重要度を見る #japanr LT
Randomforestて?高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
?
JapanR 2016でのLT資料です
驳驳辫濒辞迟2再入门(2015年バージョン)
驳驳辫濒辞迟2再入门(2015年バージョン)
yutannihilation
?
最新版はこちら: https://speakerdeck.com/yutannihilation/ggplot2zai-ru-men
ハイレゾの话
ハイレゾの话
Kazuya Wada
?
闯补辫补苍.搁2014での発表资料です
環境化学データ解析入門: 愛媛大講演資料 160728
環境化学データ解析入門: 愛媛大講演資料 160728
Akifumi Eguchi
?
爱媛大学で讲演させて顶いた环境化学データ入门についてのスライドです。误りもあるかもしれませんがお手柔らかにお愿いします。
ガンマ分布 @魁!!広島ベイズ塾
ガンマ分布 @魁!!広島ベイズ塾
Takashi Yamane
?
2015.07.26に行われたベイズ塾の発表资料です。
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
Yusuke Kita
?
奥奥顿颁楽しい!
統計的学習の基礎6章前半 #カステラ本
統計的学習の基礎6章前半 #カステラ本
Akifumi Eguchi
?
10月4日、統計的学習の基礎読書会 第8回&第9回で使用した資料です。
SeekR Search Trend Report
SeekR Search Trend Report
Takekatsu Hiramura
?
SeekR Search Trend Report (Jan-Jun 2016)
オープンデータとスポーツ振兴
オープンデータとスポーツ振兴
Nobuyuki Otomori
?
Lean Software Development at ADC2003 Japanese subtitled
Lean Software Development at ADC2003 Japanese subtitled
Kenji Hiranabe
?
Japanese subtitled version of Lean Software Development by Mary and Tom Poppendieck
時系列パーソナル?データのプライバシー
時系列パーソナル?データのプライバシー
Hiroshi Nakagawa
?
個人の購買履歴や行動履歴のような時系列データのプライバシーの保護の方向性と技術について説明している。従来焦点を当ててきたK-匿名化は時系列データには不適切で、むしろ仮名化、仮名変更、データ分割、シャッフル、サンプリングなど多様は技術を考慮すべき。 また、データベースにおける自己データの存在否定可能性(Plausible Deniability)を視野に入れるべきであることを主張。 (
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
?
统计的学习の基础 読书会で利用した资料です。
1億5000万円欲しい (ロト6のデータで遊ぶ)
1億5000万円欲しい (ロト6のデータで遊ぶ)
Takuma Hatano
?
ロト6のデータを作りました
顿蝉濒迟祭り2夜
顿蝉濒迟祭り2夜
Akifumi Eguchi
?
20160913開催の顿蝉濒迟祭り2夜の資料です。
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
Koichi Hamada
?
データマイニング+WEB勉強会 第1回(2010/02/13)での講義資料です。「はじめてでもわかる統計解析?データマイニングR言語入門」 hamadakoichi 濱田晃一。途中、質問?議論をはさむ双方向形式で進行し、1時間30分の講義を行いました。 Blog: http://d.hatena.ne.jp/hamadakoichi/20100220/p1
时系列の世界の时系列データ
时系列の世界の时系列データ
MapR Technologies Japan
?
単一数値、空間、ログデータなどの時系列データをデータセンターのエンタープライズアプリケーションでどのように扱うかに焦点をあて、OpenTSDBを例として取り上げながら時系列の核となる概念を解説。Jim ScottによるThings Expo San Jose 2014の講演より。
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
Atsushi Hayakawa
?
搁蝉迟耻诲颈辞で驳颈迟丑耻产上のパッケージを骋鲍滨でインストールできるアドインの绍介
More Related Content
Viewers also liked
(20)
Tokyor37
Tokyor37
TokorosawaYoshio
?
Rで部屋探し For slide share
Rで部屋探し For slide share
Shota Yasui
?
搁で部屋を探そうというお话です。
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
. .
?
2014.10.21 第11回「データ解析のための統計モデリング入門」読書会 LT
Randomforestて?高次元の変数重要度を見る #japanr LT
Randomforestて?高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
?
JapanR 2016でのLT資料です
驳驳辫濒辞迟2再入门(2015年バージョン)
驳驳辫濒辞迟2再入门(2015年バージョン)
yutannihilation
?
最新版はこちら: https://speakerdeck.com/yutannihilation/ggplot2zai-ru-men
ハイレゾの话
ハイレゾの话
Kazuya Wada
?
闯补辫补苍.搁2014での発表资料です
環境化学データ解析入門: 愛媛大講演資料 160728
環境化学データ解析入門: 愛媛大講演資料 160728
Akifumi Eguchi
?
爱媛大学で讲演させて顶いた环境化学データ入门についてのスライドです。误りもあるかもしれませんがお手柔らかにお愿いします。
ガンマ分布 @魁!!広島ベイズ塾
ガンマ分布 @魁!!広島ベイズ塾
Takashi Yamane
?
2015.07.26に行われたベイズ塾の発表资料です。
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
Yusuke Kita
?
奥奥顿颁楽しい!
統計的学習の基礎6章前半 #カステラ本
統計的学習の基礎6章前半 #カステラ本
Akifumi Eguchi
?
10月4日、統計的学習の基礎読書会 第8回&第9回で使用した資料です。
SeekR Search Trend Report
SeekR Search Trend Report
Takekatsu Hiramura
?
SeekR Search Trend Report (Jan-Jun 2016)
オープンデータとスポーツ振兴
オープンデータとスポーツ振兴
Nobuyuki Otomori
?
Lean Software Development at ADC2003 Japanese subtitled
Lean Software Development at ADC2003 Japanese subtitled
Kenji Hiranabe
?
Japanese subtitled version of Lean Software Development by Mary and Tom Poppendieck
時系列パーソナル?データのプライバシー
時系列パーソナル?データのプライバシー
Hiroshi Nakagawa
?
個人の購買履歴や行動履歴のような時系列データのプライバシーの保護の方向性と技術について説明している。従来焦点を当ててきたK-匿名化は時系列データには不適切で、むしろ仮名化、仮名変更、データ分割、シャッフル、サンプリングなど多様は技術を考慮すべき。 また、データベースにおける自己データの存在否定可能性(Plausible Deniability)を視野に入れるべきであることを主張。 (
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
?
统计的学习の基础 読书会で利用した资料です。
1億5000万円欲しい (ロト6のデータで遊ぶ)
1億5000万円欲しい (ロト6のデータで遊ぶ)
Takuma Hatano
?
ロト6のデータを作りました
顿蝉濒迟祭り2夜
顿蝉濒迟祭り2夜
Akifumi Eguchi
?
20160913開催の顿蝉濒迟祭り2夜の資料です。
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
Koichi Hamada
?
データマイニング+WEB勉強会 第1回(2010/02/13)での講義資料です。「はじめてでもわかる統計解析?データマイニングR言語入門」 hamadakoichi 濱田晃一。途中、質問?議論をはさむ双方向形式で進行し、1時間30分の講義を行いました。 Blog: http://d.hatena.ne.jp/hamadakoichi/20100220/p1
时系列の世界の时系列データ
时系列の世界の时系列データ
MapR Technologies Japan
?
単一数値、空間、ログデータなどの時系列データをデータセンターのエンタープライズアプリケーションでどのように扱うかに焦点をあて、OpenTSDBを例として取り上げながら時系列の核となる概念を解説。Jim ScottによるThings Expo San Jose 2014の講演より。
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
Atsushi Hayakawa
?
搁蝉迟耻诲颈辞で驳颈迟丑耻产上のパッケージを骋鲍滨でインストールできるアドインの绍介
Tokyor37
Tokyor37
TokorosawaYoshio
?
Rで部屋探し For slide share
Rで部屋探し For slide share
Shota Yasui
?
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
. .
?
Randomforestて?高次元の変数重要度を見る #japanr LT
Randomforestて?高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
?
驳驳辫濒辞迟2再入门(2015年バージョン)
驳驳辫濒辞迟2再入门(2015年バージョン)
yutannihilation
?
ハイレゾの话
ハイレゾの话
Kazuya Wada
?
環境化学データ解析入門: 愛媛大講演資料 160728
環境化学データ解析入門: 愛媛大講演資料 160728
Akifumi Eguchi
?
ガンマ分布 @魁!!広島ベイズ塾
ガンマ分布 @魁!!広島ベイズ塾
Takashi Yamane
?
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
奥奥顿颁のチケット外れても厂贵に行った方が良い理由
Yusuke Kita
?
統計的学習の基礎6章前半 #カステラ本
統計的学習の基礎6章前半 #カステラ本
Akifumi Eguchi
?
SeekR Search Trend Report
SeekR Search Trend Report
Takekatsu Hiramura
?
オープンデータとスポーツ振兴
オープンデータとスポーツ振兴
Nobuyuki Otomori
?
Lean Software Development at ADC2003 Japanese subtitled
Lean Software Development at ADC2003 Japanese subtitled
Kenji Hiranabe
?
時系列パーソナル?データのプライバシー
時系列パーソナル?データのプライバシー
Hiroshi Nakagawa
?
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
?
1億5000万円欲しい (ロト6のデータで遊ぶ)
1億5000万円欲しい (ロト6のデータで遊ぶ)
Takuma Hatano
?
顿蝉濒迟祭り2夜
顿蝉濒迟祭り2夜
Akifumi Eguchi
?
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
[データマイニング+WEB勉強会][R勉強会] はじめてでもわかる 統計解析?データマイニング R言語入門
Koichi Hamada
?
时系列の世界の时系列データ
时系列の世界の时系列データ
MapR Technologies Japan
?
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
搁蝉迟耻诲颈辞上でのパッケージインストールを便利にする补诲诲颈苍4驳颈迟丑耻产颈苍蝉迟补濒濒
Atsushi Hayakawa
?
巨人の勝率を上げたい (スクレイピングとデータ集計)
1.
巨人の勝率を上げるbot作った @gg_hatano
2.
検索 : 300億円欲しい http://gg-hogehoge.hatenablog.com/entry/2014/08/20/203431
3.
目次 ? 動機: なぜ巨人の勝率を上げるか ?
手法: どうやって巨人の勝率を上げるか ? 結果: 勝率は上がった
4.
2014年の巨人 http://baseball-data.com
5.
http://baseball-data.com 巨人が強い
6.
でも けっこう負けてる http://baseball-data.com
7.
巨人の勝率を上げたい http://baseball-data.com
8.
巨人ファンの声 ? とにかく巨人が勝てばいい
9.
目次 ? 動機: なぜ巨人の勝率を上げるか ?
手法: どうやって巨人の勝率を上げるか ? 結果: 勝率は上がった
10.
巨人の勝率計算bot こういうbot作りました
11.
巨人の勝率計算bot: 概要 yahoo!試合速報
12.
7回裏, 0アウト, ランナー無し, 0-0,
打順 スクレイプ1分に1回 yahoo!試合速報 巨人の勝率計算bot: 概要
13.
7回裏, 0アウト, ランナー無し, 0-0,
打順 スクレイプ 過去試合結果 参照 1分に1回 yahoo!試合速報 巨人の勝率計算bot: 概要
14.
7回裏, 0アウト, ランナー無し, 0-0,
打順 スクレイプ 過去試合結果 参照 twitteR 1分に1回 yahoo!試合速報 勝率bot 巨人の勝率計算bot: 概要
15.
? yahoo! プロ野球速報をスクレイプ ?
試合状況 + 過去試合結果 -> 勝率計算 ? 勝率が75%を超えたら, 僕に通知 巨人の勝率計算bot: 概要
16.
巨人の勝率を上げる手法 0% 25% 50% 75% 100% 1回 2回 3回
4回 5回 6回 7回 8回 9回 巨人の勝率: 64%
17.
巨人の勝率を上げる手法 0% 25% 50% 75% 100% 1回 2回 3回
4回 5回 6回 7回 8回 9回 勝率 巨人の勝率: 33%
18.
巨人の勝率を上げる手法 0% 25% 50% 75% 100% 1回 2回 3回
4回 5回 6回 7回 8回 9回 勝率 巨人の勝率: 78%
19.
巨人の勝率を上げる手法 0% 25% 50% 75% 100% 1回 2回 3回
4回 5回 6回 7回 8回 9回 ここでテレビをつける 勝率 巨人の勝率: 78%
20.
巨人の勝率を上げる手法 1. 野球の情報を遮断 2. 勝率が75%を超えたら,
botが通知 3. テレビをつければ, 勝率75%の世界へ
21.
巨人の勝率を上げる方法: 実践 勝率bot 運用開始の日
22.
巨人の勝率を上げる方法: 実践 75%超えたので通知, テレビつけた
23.
巨人の勝率を上げる方法: 実践 75%超えたので通知, テレビつけた
24.
巨人の勝率を上げる方法: 実践 逆転3ラン打たれた
25.
巨人の勝率を上げる方法: 実践 利用者の声
26.
巨人の勝率を上げる方法: 実践 逆転負けは仕方ない
27.
巨人の勝率を上げる手法 1. 野球の情報を遮断 2. 自動勝率計算.
75%を超えたら通知. 3. テレビをつければ, そこは勝率75%の世界
28.
http://www.nikkansports.com/baseball/professional/climax/2014/ 巨人の勝率を上げる方法: 実践 クライマックスシリーズ 第2ステージ
29.
http://www.nikkansports.com/baseball/professional/climax/2014/ 巨人の勝率を上げる方法: 実践 クライマックスシリーズ 第2ステージ
30.
巨人の勝率を上げる方法: 実践 ? 負け試合を見ないことで,
辛さを軽减
31.
巨人の勝率を上げる手法 ? まとめ ? 巨人の勝率計算bot
+ 通知 ? 僕の脳内で, 巨人の勝率が75%になる ? 展望 ? 勝率計算の精緻化
32.
発表内容: 詳細 http://gg-hogehoge.hatenablog.com/entry/2014/08/20/203431
33.
補足: 勝率の計算方法 7回裏, 0アウト, ランナー無し,
0-0, 打順 スクレイプ yahoo! プロ野球 メジャーリーグ80年分の過去試合 試合状況を 勝率: 59%
34.
? 手順 ? メジャーリーグ全打席結果データを用意 ?
試合状況ごとに, 勝率を計算 補足: 勝率の計算方法 ? 展望 ? 日本の過去全打席結果データが欲しい
Download