26. (恐らく)普通の解決法
? Hive
– MapReduceのフロントエンド
– SQLライクなクエリでアドホックに
MapReduceを実行できる
– 逐一実行形式なのでバッチジョブは不要
– その分検索として使ったときのレイテンシは
高い
SELECT user_id FROM activity_log
WHERE activity_type = ‘5’
AND date = ‘2013-08-24’
GROUP BY user_id
HAVING COUNT(user_id) >= 5