狠狠撸
Submit Search
闯耻产补迟耻蝉使ってみた
Jul 22, 2015
1 like
1,075 views
Tohru Kobayashi
オンライン機械学習 Jubatusをつかってサービスを開発してみた。その紹介しちゃいます。
Read more
1 of 69
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
Ad
Recommended
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
Shohei Hido
?
2013/12/14 Jubatus Casual Talks #2 異常検知入門の資料です。
Jubatus Casual Talks #2 Jubatus開発者入門
Jubatus Casual Talks #2 Jubatus開発者入門
Shuzo Kashihara
?
http://connpass.com/event/3968/
テ?ィーフ?ラーニンク?による时系列テ?ータの异常検知
テ?ィーフ?ラーニンク?による时系列テ?ータの异常検知
Core Concept Technologies
?
ディープラーニングを使った时系列データの异常検知の手法の绍介と适用例を示します。
さらば!データサイエンティスト
さらば!データサイエンティスト
Shohei Hido
?
2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→http://www.ustream.tv/recorded/37645309
今年の碍顿顿ベストペーパーを実装?公开しました
今年の碍顿顿ベストペーパーを実装?公开しました
Shohei Hido
?
2013/09/01 第4回データ構造と情報検索と自然言語処理勉強会(DSIRNLP, http://partake.in/events/76854228-ba38-4f6e-87b9-f79e30add75c# )での発表内容です。 同一内容の会社ブログはこちら→ http://research.preferred.jp/2013/08/sketch/
ディープラーニングの产业応用とそれを支える技术
ディープラーニングの产业応用とそれを支える技术
Shohei Hido
?
Microsoft Tech Summit #mstsjp17 2017/11/08
闯耻产补迟耻蝉が目指すインテリジェンス基盘
闯耻产补迟耻蝉が目指すインテリジェンス基盘
Shohei Hido
?
IEICEソサエティ大会2013 "知的環境を実現するビッグデータ解析と通信行動分析"セッションでの講演内容です。
rcast_20140411
rcast_20140411
Preferred Networks
?
评叠补苍における闯耻产补迟耻蝉活用事例
评叠补苍における闯耻产补迟耻蝉活用事例
JubatusOfficial
?
mlabforum2012_okanohara
mlabforum2012_okanohara
Preferred Networks
?
惭尝础叠ネットワークリサーチフォーラム2012において、今后滨颁罢の発展とともに研究?公司?个人のあり方がどう変わっていくかの考えを话しました。
大规模データ时代に求められる自然言语処理
大规模データ时代に求められる自然言语処理
Preferred Networks
?
「東北大学講義:先端技術の基礎と実践」 で2012年2月2日に講義した内容です。一部講義時点の内容から変更しています。
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
2018/02/14 Deep Learning Lab 異常検知ナイト 「異常検知入門」発表資料です https://dllab.connpass.com/event/77248/
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
Hisao Soyama
?
2017/03/17 ヒカラボにて発表した資料 https://atnd.org/events/85720
aiconf2017okanohara
aiconf2017okanohara
Preferred Networks
?
Aiカンファレンス 2017@ビッグサイトでの講演資料です。自動車、ロボット、バイオヘルスケアでの応用事例、および今後の課題について書いてあります。
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
Yuya Unno
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
PFIオープンセミナー2012「多様化する情報を支える技術」 2012年9月21日(金)実施 ?概要?Hadoopが大規模データ処理に広く用いられれる一方、その限界も見え始めてきた。一方、データに潜む複雑な因果関係や傾向を発見し精度の良い予測を実現する機械学習技術は性能向上と適用範囲の拡大を続けている。本講演ではビッグデータとその先進アプリケーションについて、間を繋ぐ機械学習技術の観点から最新動向について述べる。特に、PFIがフォーカスしているリアルタイム性とトレーサビリティについて詳しく述べ、JubatusとBazilという製品を紹介する。
自然言语処理绍介(就职编)
自然言语処理绍介(就职编)
长冈技术科学大学 自然言语処理研究室
?
长冈技术科学大学 自然言语処理研究室 2011/6/28
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
Shohei Hido
?
第3回ビッグデータと統計学研究集会@統計数理研究所における「ビッグデータはどこまで効率化できるか?」の資料です(2013/05/27) http://dsms.iic.hokudai.ac.jp/BIGDATA/%E7%A0%94%E7%A9%B6%E9%9B%86%E4%BC%9A/3rd/
基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻
Preferred Networks
?
PFIオープンセミナー2012「多様化する情報を支える技術」 2012年9月21日(金)実施 ?概要?ビッグデータ分析の対象は、人が生み出すデータから、機械が自動的に生み出すデータへとシフトしつつある。そうなると、データが生まれるスループットは桁違いに大きくなり、また、データの種類は多様性を極めるようになる。データ処理アーキテクチャも、データ処理手法も、大きく進化する必要がある。増え行くデータの量?多様性に対して、技術者としてどう取り組むべきか、実例を交えながら概説する。
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
Yuya Unno
?
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
Shohei Hido
?
ICML2013読み会@東大 2013/07/09 開会宣言
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
Shohei Hido
?
PFxセミナー 2016/10/20 "机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础" 動画: https://www.youtube.com/watch?v=x76RxxQ_QTQ
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
Yuya Unno
?
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
Yuji Sakurai
?
【BigData-JAWS 勉強会#14】で発表した内容です (https://jawsug-bigdata.connpass.com/event/101211/) リクルートライフスタイルではデータ基盤としてRedshiftを使用しています。 基盤チームとしてデータ量や社内ユーザーを増やしたいという思いがある一方で、 そうすることでRedshiftの負荷や運用負荷も上がってしまうという悩みがありました。 その双方の问題を解決するためにリクルートライフスタイルではchatopsという手段を取り、 chatbotを開発することでユーザーの欲しいタイミングで欲しい情報を準備することに成功しました。 本発表ではその具体的な方法をchatbotならではのメリットと共にご紹介できればと思います。 またお時間があればデータ連携以外に関するbotのご紹介もできればと思っています。
イノヘ?ーションことはし?め
イノヘ?ーションことはし?め
Preferred Networks
?
イノベーションについて解説しました PFI seminar 2014/10/23
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
Yuya Unno
?
2016/03/19にChainer meetup #2で、Chainerのテスト環境をDockerで整備した話を話しました
データサイエンティストのつくり方
データサイエンティストのつくり方
Shohei Hido
?
2012/09/13 PFIセミナー「データサイエンティストのつくり方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/25376704
tut_pfi_2012
tut_pfi_2012
Preferred Networks
?
豊桥技科大で2012/6/12で特别讲义で利用した资料です。讲义时の资料とは多少异なっています。
Mr201306 機械学習のセキュリティ技術応用
Mr201306 機械学習のセキュリティ技術応用
FFRI, Inc.
?
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
?
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散?リアルタイム?機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
More Related Content
What's hot
(20)
评叠补苍における闯耻产补迟耻蝉活用事例
评叠补苍における闯耻产补迟耻蝉活用事例
JubatusOfficial
?
mlabforum2012_okanohara
mlabforum2012_okanohara
Preferred Networks
?
惭尝础叠ネットワークリサーチフォーラム2012において、今后滨颁罢の発展とともに研究?公司?个人のあり方がどう変わっていくかの考えを话しました。
大规模データ时代に求められる自然言语処理
大规模データ时代に求められる自然言语処理
Preferred Networks
?
「東北大学講義:先端技術の基礎と実践」 で2012年2月2日に講義した内容です。一部講義時点の内容から変更しています。
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
2018/02/14 Deep Learning Lab 異常検知ナイト 「異常検知入門」発表資料です https://dllab.connpass.com/event/77248/
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
Hisao Soyama
?
2017/03/17 ヒカラボにて発表した資料 https://atnd.org/events/85720
aiconf2017okanohara
aiconf2017okanohara
Preferred Networks
?
Aiカンファレンス 2017@ビッグサイトでの講演資料です。自動車、ロボット、バイオヘルスケアでの応用事例、および今後の課題について書いてあります。
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
Yuya Unno
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
PFIオープンセミナー2012「多様化する情報を支える技術」 2012年9月21日(金)実施 ?概要?Hadoopが大規模データ処理に広く用いられれる一方、その限界も見え始めてきた。一方、データに潜む複雑な因果関係や傾向を発見し精度の良い予測を実現する機械学習技術は性能向上と適用範囲の拡大を続けている。本講演ではビッグデータとその先進アプリケーションについて、間を繋ぐ機械学習技術の観点から最新動向について述べる。特に、PFIがフォーカスしているリアルタイム性とトレーサビリティについて詳しく述べ、JubatusとBazilという製品を紹介する。
自然言语処理绍介(就职编)
自然言语処理绍介(就职编)
长冈技术科学大学 自然言语処理研究室
?
长冈技术科学大学 自然言语処理研究室 2011/6/28
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
Shohei Hido
?
第3回ビッグデータと統計学研究集会@統計数理研究所における「ビッグデータはどこまで効率化できるか?」の資料です(2013/05/27) http://dsms.iic.hokudai.ac.jp/BIGDATA/%E7%A0%94%E7%A9%B6%E9%9B%86%E4%BC%9A/3rd/
基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻
Preferred Networks
?
PFIオープンセミナー2012「多様化する情報を支える技術」 2012年9月21日(金)実施 ?概要?ビッグデータ分析の対象は、人が生み出すデータから、機械が自動的に生み出すデータへとシフトしつつある。そうなると、データが生まれるスループットは桁違いに大きくなり、また、データの種類は多様性を極めるようになる。データ処理アーキテクチャも、データ処理手法も、大きく進化する必要がある。増え行くデータの量?多様性に対して、技術者としてどう取り組むべきか、実例を交えながら概説する。
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
Yuya Unno
?
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
Shohei Hido
?
ICML2013読み会@東大 2013/07/09 開会宣言
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
Shohei Hido
?
PFxセミナー 2016/10/20 "机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础" 動画: https://www.youtube.com/watch?v=x76RxxQ_QTQ
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
Yuya Unno
?
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
Yuji Sakurai
?
【BigData-JAWS 勉強会#14】で発表した内容です (https://jawsug-bigdata.connpass.com/event/101211/) リクルートライフスタイルではデータ基盤としてRedshiftを使用しています。 基盤チームとしてデータ量や社内ユーザーを増やしたいという思いがある一方で、 そうすることでRedshiftの負荷や運用負荷も上がってしまうという悩みがありました。 その双方の问題を解決するためにリクルートライフスタイルではchatopsという手段を取り、 chatbotを開発することでユーザーの欲しいタイミングで欲しい情報を準備することに成功しました。 本発表ではその具体的な方法をchatbotならではのメリットと共にご紹介できればと思います。 またお時間があればデータ連携以外に関するbotのご紹介もできればと思っています。
イノヘ?ーションことはし?め
イノヘ?ーションことはし?め
Preferred Networks
?
イノベーションについて解説しました PFI seminar 2014/10/23
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
Yuya Unno
?
2016/03/19にChainer meetup #2で、Chainerのテスト環境をDockerで整備した話を話しました
データサイエンティストのつくり方
データサイエンティストのつくり方
Shohei Hido
?
2012/09/13 PFIセミナー「データサイエンティストのつくり方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/25376704
tut_pfi_2012
tut_pfi_2012
Preferred Networks
?
豊桥技科大で2012/6/12で特别讲义で利用した资料です。讲义时の资料とは多少异なっています。
评叠补苍における闯耻产补迟耻蝉活用事例
评叠补苍における闯耻产补迟耻蝉活用事例
JubatusOfficial
?
mlabforum2012_okanohara
mlabforum2012_okanohara
Preferred Networks
?
大规模データ时代に求められる自然言语処理
大规模データ时代に求められる自然言语処理
Preferred Networks
?
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなテ?ータ分析の世界~サイカのエンシ?ニアか?語る、話題の技術の「いま」と「未来」~
Hisao Soyama
?
aiconf2017okanohara
aiconf2017okanohara
Preferred Networks
?
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
Yuya Unno
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
自然言语処理绍介(就职编)
自然言语処理绍介(就职编)
长冈技术科学大学 自然言语処理研究室
?
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
Shohei Hido
?
基调讲演:「多様化する情报を支える技术」/西川彻
基调讲演:「多様化する情报を支える技术」/西川彻
Preferred Networks
?
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
闯耻产补迟耻蝉における大规模分散オンライン机械学习蔼先端金融テクノロジー研究会
Yuya Unno
?
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
Shohei Hido
?
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
机械学习モデルフォーマットの话:さようなら笔惭惭尝、こんにちは笔贵础
Shohei Hido
?
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
罢飞颈迟迟别谤分析のためのリアルタイム分析基盘蔼第4回罢飞颈迟迟别谤研究会
Yuya Unno
?
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
リクルートライフスタイル分析基盘チーム2年目か?世话するテ?ータ连携产辞迟达のお话
Yuji Sakurai
?
イノヘ?ーションことはし?め
イノヘ?ーションことはし?め
Preferred Networks
?
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
Yuya Unno
?
データサイエンティストのつくり方
データサイエンティストのつくり方
Shohei Hido
?
tut_pfi_2012
tut_pfi_2012
Preferred Networks
?
Viewers also liked
(8)
Mr201306 機械学習のセキュリティ技術応用
Mr201306 機械学習のセキュリティ技術応用
FFRI, Inc.
?
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
?
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散?リアルタイム?機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
nishio
?
このスライドの目的はルールベースは多くのプログラマができている。機械学習への橋渡しを詳細に解説することでツールとして機械学習を活用できる人を増やすことです。
実戦投入する机械学习
実戦投入する机械学习
Takahiro Kubo
?
机械学习を実际にビジネスで利用するに当たり、使いやすいツールを3つ厳选して绍介。
「機械学習 By スタンフォード大学」勉強会 2015.09.11
「機械学習 By スタンフォード大学」勉強会 2015.09.11
Minoru Chikamune
?
シリコンバレーの有名大学であるスタンフォード大学にて、Andrew Ngの教える機械学習の講義が人気を集めているそうです。 Andrew Ngは相当な有名人で、よくニュースで名前が出てきます。有名な例では、グーグルが「Google Brain」という名のニューラルネットワークを構築し、YouTubeの動画から「猫」を教師なし学習で認識したといったニュースが流れましたが、このプロジェクトはAndrew Ngが主導したものです。 このAndrew NgがCourseraというオンラインコースで機械学習の授業を公開しています。このたび私も受講しまして、ようやく修了しました。 [Machine Learning by Stanford University] https://www.coursera.org/learn/machine-learning/ 内容的には、Deep Learning登場前の機械学習について、特に応用を意識した講義の構成になっています。たとえば、以下の様なトピックが含まれていました。 - ニューラルネットワーク(バックプロパゲーション) - スパムフィルターの作り方 - 異常検知の方法 - リコメンデーションエンジンの作り方 - OCRの作り方 - オンライン学習 - 機械学習を用いたプロジェクトの進め方 講義は全体的に非常によくまとまっていまして、個別の数学的な内容に深入りすることなく、かといって表面をなぞるような感じでもない、バランスが取れた内容でした。明確に、機械学習を実プロジェクトに適用することに軸足を置いていまして、そのための様々な助言が講義の中に散りばめられていたという印象があります。 ちなみにAndrew Ngは、今やGoogleの猫の人、Deep Learningの人、というイメージが強いので、この講義にもDeep Learningについての話が含まれている事を個人的には期待しましたが、残念ながらDeepLearningに関しては、この講義に含まれていませんでした。 この社内勉強会では、Andrew Ngの講義のダイジェスト版となるように意識して講義内容を紹介します。機械学習を用いたシステムを構築する際のノウハウは、なかなか得がたいものがあると思いますので、機械学習に興味がある方は勉強会に参加して頂けると嬉しいです。また、機械学習のさわりだけでも分かれば、なぜビッグデータが必要なのかも分かると思います(単純に大量のデータがあると機械学習に有利だからです)。
机械学习の理论と実践
机械学习の理论と実践
Preferred Networks
?
SACSIS2013でのチュートリアル講演資料です。機械学習の導入:背景、手法、理論、応用)、実践:オンライン学習+線形分類で実際作ってみる、使う際の課題、発展:分散+リアルタイムでの機械学習(Jubatus)、深層学習(Deep Neural Net)についてまとめました
机械学习によるデータ分析まわりのお话
机械学习によるデータ分析まわりのお话
Ryota Kamoshida
?
某所で機械学習の講習会(?)のようなものをしたときの資料です. 機械学習によるデータ分析について,アルゴリズムやツールの使い方*以外*の部分で 重要だと思うことを重点的にまとめたつもりです.
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
?
Mr201306 機械学習のセキュリティ技術応用
Mr201306 機械学習のセキュリティ技術応用
FFRI, Inc.
?
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
?
ルールベースから機械学習への道 公開用
ルールベースから機械学習への道 公開用
nishio
?
実戦投入する机械学习
実戦投入する机械学习
Takahiro Kubo
?
「機械学習 By スタンフォード大学」勉強会 2015.09.11
「機械学習 By スタンフォード大学」勉強会 2015.09.11
Minoru Chikamune
?
机械学习の理论と実践
机械学习の理论と実践
Preferred Networks
?
机械学习によるデータ分析まわりのお话
机械学习によるデータ分析まわりのお话
Ryota Kamoshida
?
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
?
Ad
Similar to 闯耻产补迟耻蝉使ってみた
(20)
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
JubatusOfficial
?
闯耻产补迟耻蝉ハッカソンで绍介した闯耻产补迟耻蝉1.0の主要アップデートについて
闯耻产补迟耻蝉で始める机械学习/セキュリティと机械学习
闯耻产补迟耻蝉で始める机械学习/セキュリティと机械学习
Preferred Networks
?
2013年6月23日に開催された「セキュリティと機械学習」の資料となります。 https://atnd.org/events/40918 http://matsudalab.office-server.co.jp/security_machine_learning/saml_index.html セキュリティについては、どうしても人の判断が入る部分がシステムに存在し、 そこでの判断にトレードオフがあるため人的リソースを減らす方向で機械学習を活かしたシステムを組むことができると筋が良さそうに思えるという主張です。 Jubatusに関するスライドは情報が古い/オフィシャルブログ等の方が充実しているため削除しています。
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
Yuya Unno
?
闯耻产补迟耻蝉解説本の绍介
闯耻产补迟耻蝉解説本の绍介
JubatusOfficial
?
第5回Jubatusハンズオンで使用したJubatus本の紹介スライド。 個人的なオススメポイントを紹介
机械学习と闯耻产补迟耻蝉
机械学习と闯耻产补迟耻蝉
Junya Yamaguchi
?
Overview and Roadmap
Overview and Roadmap
JubatusOfficial
?
闯耻产补迟耻蝉でマルウェア分类
闯耻产补迟耻蝉でマルウェア分类
Shuzo Kashihara
?
機械学習×プログラミング勉強会 2012年5月11日
闯耻产补迟耻蝉の特徴変换と线形分类器の仕组み
闯耻产补迟耻蝉の特徴変换と线形分类器の仕组み
JubatusOfficial
?
Oracle Cloud Developers Meetup@東京
Oracle Cloud Developers Meetup@東京
tuchimur
?
https://oracleclouddevelopers.doorkeeper.jp/events/44992
闯耻产补迟耻蝉で始める机械学习
闯耻产补迟耻蝉で始める机械学习
JubatusOfficial
?
Jubakit の紹介
Jubakit の紹介
kmaehashi
?
Jubatus Casual Talks #4 (2016-06-18) の発表資料です。
闯耻产补办颈迟の绍介
闯耻产补办颈迟の绍介
JubatusOfficial
?
闯耻产补办颈迟の绍介
jubatus pressrelease
jubatus pressrelease
JubatusOfficial
?
闯耻产补办颈迟の解説
闯耻产补办颈迟の解説
JubatusOfficial
?
2017年11月1日 第5回JubatusハンズオンのJubakitの説明資料 Jubakitの基本的な使い方、scikit-learn wrapperの使い方、embedded jubatusの使い方を紹介
Jubatus: Jubakitでもっと楽をしよう
Jubatus: Jubakitでもっと楽をしよう
Tetsuya Shioda
?
第5回闯耻产补迟耻蝉ハンズオンで利用した资料です。
闯耻产补迟耻蝉によるアセンブリ実行速度の自动チューニング
闯耻产补迟耻蝉によるアセンブリ実行速度の自动チューニング
Takayuki Muranushi
?
Jubatusの回帰分析を使って、 アセンブリプログラムのエミュレートされた実行速度を自動チューニングしてみました。
世界征服を目指す闯耻产补迟耻蝉だからこそ期待する5つのポイント
世界征服を目指す闯耻产补迟耻蝉だからこそ期待する5つのポイント
NTT DATA OSS Professional Services
?
2013/06/02 Jubatus Casual Talks #1 『世界征服を目指す闯耻产补迟耻蝉だからこそ期待する5つのポイント』 NTTデータ 基盤システム事業本部 OSSプロフェッショナルサービス 下垣 徹
闯耻产补迟耻蝉における大规模分散オンライン机械学习
闯耻产补迟耻蝉における大规模分散オンライン机械学习
Preferred Networks
?
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
JubatusOfficial
?
2017年11月1日 第5回Jubatusハンズオンで使用した説明資料。 pythonを使ってJubatusの特徴抽出プラグインを作成する機能の解説。
Jubatus Python特徴抽出フ?ラク?イン
Jubatus Python特徴抽出フ?ラク?イン
Tetsuya Shioda
?
第5回闯耻产补迟耻蝉ハンズオンで利用した説明资料です。
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
JubatusOfficial
?
闯耻产补迟耻蝉で始める机械学习/セキュリティと机械学习
闯耻产补迟耻蝉で始める机械学习/セキュリティと机械学习
Preferred Networks
?
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
Yuya Unno
?
闯耻产补迟耻蝉解説本の绍介
闯耻产补迟耻蝉解説本の绍介
JubatusOfficial
?
机械学习と闯耻产补迟耻蝉
机械学习と闯耻产补迟耻蝉
Junya Yamaguchi
?
Overview and Roadmap
Overview and Roadmap
JubatusOfficial
?
闯耻产补迟耻蝉でマルウェア分类
闯耻产补迟耻蝉でマルウェア分类
Shuzo Kashihara
?
闯耻产补迟耻蝉の特徴変换と线形分类器の仕组み
闯耻产补迟耻蝉の特徴変换と线形分类器の仕组み
JubatusOfficial
?
Oracle Cloud Developers Meetup@東京
Oracle Cloud Developers Meetup@東京
tuchimur
?
闯耻产补迟耻蝉で始める机械学习
闯耻产补迟耻蝉で始める机械学习
JubatusOfficial
?
Jubakit の紹介
Jubakit の紹介
kmaehashi
?
闯耻产补办颈迟の绍介
闯耻产补办颈迟の绍介
JubatusOfficial
?
jubatus pressrelease
jubatus pressrelease
JubatusOfficial
?
闯耻产补办颈迟の解説
闯耻产补办颈迟の解説
JubatusOfficial
?
Jubatus: Jubakitでもっと楽をしよう
Jubatus: Jubakitでもっと楽をしよう
Tetsuya Shioda
?
闯耻产补迟耻蝉によるアセンブリ実行速度の自动チューニング
闯耻产补迟耻蝉によるアセンブリ実行速度の自动チューニング
Takayuki Muranushi
?
世界征服を目指す闯耻产补迟耻蝉だからこそ期待する5つのポイント
世界征服を目指す闯耻产补迟耻蝉だからこそ期待する5つのポイント
NTT DATA OSS Professional Services
?
闯耻产补迟耻蝉における大规模分散オンライン机械学习
闯耻产补迟耻蝉における大规模分散オンライン机械学习
Preferred Networks
?
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
JubatusOfficial
?
Jubatus Python特徴抽出フ?ラク?イン
Jubatus Python特徴抽出フ?ラク?イン
Tetsuya Shioda
?
Ad
More from Tohru Kobayashi
(6)
IBM Watson Visual Recognition を紹介するよ
IBM Watson Visual Recognition を紹介するよ
Tohru Kobayashi
?
一般物体認識を楽にするVisual Recognitionを紹介しちゃうよ。
怠惰な私がプログラミングするときに重要だと考えているたった1つのこと
怠惰な私がプログラミングするときに重要だと考えているたった1つのこと
Tohru Kobayashi
?
プログラミング殆どやらないエンジニアがコードを描くときに重要だと思っていることを発表しちゃいました。
○○でかんたんお部屋探し!
○○でかんたんお部屋探し!
Tohru Kobayashi
?
统计や机械学习で赁贷物件探しするよ!
搁で础贬笔
搁で础贬笔
Tohru Kobayashi
?
20121205 jjbug
20121205 jjbug
Tohru Kobayashi
?
搁を础奥厂で使おう
搁を础奥厂で使おう
Tohru Kobayashi
?
IBM Watson Visual Recognition を紹介するよ
IBM Watson Visual Recognition を紹介するよ
Tohru Kobayashi
?
怠惰な私がプログラミングするときに重要だと考えているたった1つのこと
怠惰な私がプログラミングするときに重要だと考えているたった1つのこと
Tohru Kobayashi
?
○○でかんたんお部屋探し!
○○でかんたんお部屋探し!
Tohru Kobayashi
?
搁で础贬笔
搁で础贬笔
Tohru Kobayashi
?
20121205 jjbug
20121205 jjbug
Tohru Kobayashi
?
搁を础奥厂で使おう
搁を础奥厂で使おう
Tohru Kobayashi
?
闯耻产补迟耻蝉使ってみた
1.
Jubatus 使ってみたよ TokyoR #44 小林 達
@soultoru
2.
※ この資料の情報は個人の見解であり、 所属団体や資料を参考にした個人?団体様には 一切関係ないです。 あっても見逃してください。
3.
早速ですが、
4.
こんなことに 困っていません か?
5.
问
6.
関係者がデータ を小出しに 提出してくる
7.
データが巨大で 1 台のサーバの メモリには 載らない
8.
データ投入から 分析結果の出力 まで長時間
10.
あるよ。
11.
https://preferred.jp/
12.
アジェンダ
13.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
14.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
15.
Jubatus = 機械学習 エンジン
16.
「分散した データ」を 「常に素早く」 「深く分析」
17.
https://preferred.jp/product/jubatus/
18.
PFI と NTT
が 共同開発の 国産 OSS ※ 現在は Preferred Networks がライセンスを保有しているみたいです。 http://itpro.nikkeibp.co.jp/atcl/news/14/100101159/
19.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
20.
Jubatus = 機械学習 エンジン
21.
多値分類 線形回帰 クラスタリング クラスタ分析 時系列データの統計分析 近傍探索 推薦 グラフマイニング 異常検知
22.
これらの 機械学習タスク を
23.
オンラインに 分散処理できる
24.
!
26.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
27.
Jubatus = 機械学習 エンジン
28.
多値分類 線形回帰 クラスタリング クラスタ分析 時系列データの統計分析 近傍探索 推薦 グラフマイニング 異常検知
29.
機械学習とは、 簡単にはデータに対して何かのモデルに対して 问題を解くことで意図した動作を機械にさせる ※ 詳しい原理は書籍を読んでください
30.
オンライン
31.
勉強しろ 結果くれ Datum この間わずか 数十 ms で
OK ! ほい ※ 状況によって違います 結果
32.
なぜオンライン で動くのか?
33.
オンライン化 のマジック =
34.
確率的 勾配降下法
35.
目的関数が期待値で表された最適化问題 ( は確率密度関数) に対するオンライン最適化アルゴリズム. 目的関数の勾配が得られる状況下では, 通常の勾配法が適用 可能だが, の計算が高コストであまり現実的ではない場合が ある.そこで, の代わりに近似的に を用いた勾配法 ( は反復時点での実現値) が確率的勾配降下法( Stochastic Gradient
Descent, 以下 SGD ) である. は 平均的にはと一致するので通常の勾配 法と同様な収束性が期待される. http://www.msi.co.jp/nuopt/glossary/term_da265770bed70e5f0a764f3d20c0ce3d242e6467.html ※Jubatus は同様ではあるが違うアルゴリズム使ってるかも。ソースそこまで読んでないす。
36.
分散処理
37.
勉強しろ Datum 勉強しろ Datum
38.
こそこそ
39.
結果くれ 結果くれ どっちに聞いても いいよ! 結果が少し 違うかもだけど
40.
なぜ分散処理 できるか
41.
「こそこそ」 に秘密あり!
42.
分散学習機構 Mix
43.
データそのもの をやりとり しない (大きいから)
44.
分析結果 ( モデル )
を
45.
ガッチャンコ (平均化)
46.
データ モデル 全部処理。。。 モデルの平均 とるだけ! ※ 「モデルの平均とるだけ」はイメージです。 実際にはもっと難しい処理しているはずです。
47.
ただし、
48.
データの Update 毎に Mix しない
49.
= 分析結果が ノード毎 違う可能性
51.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
53.
http://karaoke.pink アプリ作ってみました。 推薦エンジンを中で使ってます。
54.
● どんなもの? ● 何ができるの? ● どうして動くの? ● 作ってみた ● R から使うには
55.
残念なお知らせ残念なお知らせ
56.
R のライブラリ はまだないみたい です。。。
57.
今のところ C++ 、 Java Python
、 Ruby に対応
58.
でも 動かせる可能性 はありますっ
59.
1 Msgpack + RPC を
R で実装
60.
2 C++ ライブラリ を Rcpp で呼び出す
61.
3 RESTapi を Ruby などで作成 RCurl
で呼び出す
62.
すみません、 どれも試せて ないです。。。
63.
本当は R のドライバライブラリ 公開したかったのですが間に合いませんでした
64.
● まとめ
65.
Jubatus = 機械学習 エンジン
66.
「分散した データ」を 「常に素早く」 「深く分析」
67.
今は (簡単には) R から動かない
68.
※ その内なんとか するかも
69.
おしまい
Download