Silicon Valley x 日本 / Tech x Business Meetup #12 (2015/04/17)
『並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ』
NTTデータ 基盤システム事業本部
システム方式技術事業部 OSSプロフェッショナルサービス
鯵坂 明
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...MapR Technologies Japan
?
機械学習は、増え続けるデータをもとに、事業戦略の判断やより正確な予測、関連性の推定を行うための、重要なツールです。機械学習の中でも、最も幅広く活用されているアプリケーションはレコメンデーションエンジンです。スケーラブルな機械学習ライブラリであるMahoutは、レコメンデーションの生成とデータの扱いをシンプルなものにしてくれます。本講演では、より構築が簡単なレコメンデーションエンジンのデザインと、そのイノベーティブな実装方法を活用した場合の利点を紹介します。2014年7月8日に開催されたHadoop Conference Japan 2014での講演資料です。
Silicon Valley x 日本 / Tech x Business Meetup #12 (2015/04/17)
『並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ』
NTTデータ 基盤システム事業本部
システム方式技術事業部 OSSプロフェッショナルサービス
鯵坂 明
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...MapR Technologies Japan
?
機械学習は、増え続けるデータをもとに、事業戦略の判断やより正確な予測、関連性の推定を行うための、重要なツールです。機械学習の中でも、最も幅広く活用されているアプリケーションはレコメンデーションエンジンです。スケーラブルな機械学習ライブラリであるMahoutは、レコメンデーションの生成とデータの扱いをシンプルなものにしてくれます。本講演では、より構築が簡単なレコメンデーションエンジンのデザインと、そのイノベーティブな実装方法を活用した場合の利点を紹介します。2014年7月8日に開催されたHadoop Conference Japan 2014での講演資料です。
Beginner must-see! A future that can be opened by learning HadoopDataWorks Summit
?
What is "Hadoop" now? It is difficult to hear ... But those who are interested, those who are thinking about the future as active as a data engineer, those who are new to the first time, through introductions of Hadoop and the surrounding ecosystem, introducing merits and examples, "What now Should I learn? "And I will introduce the future spreading through learning Hadoop and the surrounding ecosystem.
English follows Japanese.
筑波技術大学アレクサスキル開発チームがJAWS のユーザグループで登壇した内容です.視覚障害者の開発についても少しだけ触れています.
This is a presentation given by the Tsukuba University of Technology Alexa Skills Development Team at a JAWS user group. It also touches briefly on development for visually impaired people.
Guidance for beginners and experts on how to set up a Windows driver developm...Atomu Hidaka
?
This explains how to build a Windows driver development environment that can be used immediately by beginners and experts alike. The author, who has extensive experience developing various Windows drivers, shows the latest and simplest ways to use Visual Studio and WDK.
44. Map処理 import sys for line in sys.stdin: words = line.rstrip().split() for w in words: print “%s\t%d” % (w,1) python でワードカウントを書くには、たったこれだけで十分
45. Map処理(ちょっと改造) import sys d = {} for line in sys.stdin: words = line.rstrip().split() for w in words: d[w] = d.get(w,0) + 1 for word,count in d.iteritems(): print “%s\t%d” % (word,count) 出力行数を少し減らす
47. Reduce処理 import sys d = {} for line in sys.stdin: word,count = line.rstrip().split('\t') d[word] = d.get(word,0) + int(count) for word,count in d.iteritems(): print “%s\t%d” % (word,count) こっちも簡単
70. Data-Intensive Text Processing with MapReduce, http://www.umiacs.umd.edu/~jimmylin/book.html Facebook has the world's largest Hadoop cluster!, http://hadoopblog.blogspot.com/2010/05/facebook-has-worlds-largest-hadoop.html