Embulk, an open-source plugin-based parallel bulk data loaderSadayuki Furuhashi
?
The document discusses Embulk, an open-source parallel bulk data loader that uses plugins. Embulk loads records from various sources ("A") to various targets ("B") using plugins for different source and target types. This makes the painful process of data integration more relaxed. Embulk executes in parallel, validates data, handles errors, behaves deterministically, and allows for idempotent retries of bulk loads.
Sapporo CEDEC2014での講演資料です。
ソーシャルゲームの流行に伴って一躍脚光を浴びた、ビッグデータによる「分析」という手法ですが、分析という言葉が一人歩きして、どんなときにその強みを発揮するか、あまり知られていません。
本発表では、なぜソーシャルゲームでは分析が必要になったかを簡単に整理したうえで、具体的な分析の失敗例?成功例を通して、数字の手助けで、どのようなことが分かるのかを解説します。