データサイエンティストのための
Spark 入門
昨今、データサイエンティストの間で「Spark」の人気が高まっています。データをインメモリで高速に処理できるSparkを使うと、大規模なデータを扱う際にもストレスなく分析できます。
今回の第3回 Big Data University - 東京ミートアップでは、RStudioで作ったプログラムを Spark上で実行してみる方法を解説します。
また、合わせて、Rや Sparkとの対話環境である Data Scientist Workbench の使い方を紹介します。
こちらは前半資料となります。