狠狠撸

I-Scover チャレンジ 2014
論文紹介 Twitter bot
鈴木　英友

「より効率的で多角的な論文探しのサポ
ート」
コンセプト

作品概要
? 目的
- 本 bot のツイートを見る人に対して以下を提供
- 新たな知見の獲得
- 有益な論文の発見
? 形態
- Twitter bot
- アカウント： @research_friend
? 機能
- 毎日１件論文をランダムに紹介する
- フォローされた場合自動でフォローする
- 毎週１件論文をレコメンドする
（いずれかのツイートをリツイートしたフォロワーの
み）
基本情報

機能説明
? 機能目的
- ランダムに提示される論文から気になっ
たものを読むことによる、新たな知見の
獲得
? 頻度
- 毎日１件
? 使用データセット
- I-Scover データセット
（ articles_all.xml 、 articlekw_all.xml ）
? ツイート内容
- タイトル（日本語優先）
- キーワード
- I-Scover 上の URL
ランダム紹介

機能説明
? 機能目的
- 機械的なレコメンドにより従来の調べ方
では見つけられなかった、有益な論文
の発見
? 頻度
- 毎週月曜日１件
（デイリーツイートをリツイートした
フォロワーのみ）
? 使用データセット?ツイート内容
- 「ランダム紹介」機能と同じ
レコメンド

機能説明
? 機能目的
- 機械的なレコメンドにより従来の調べ方
では見つけられなかった、有益な論文
の発見
? レコメンドアルゴリズム
- ハイブリッド協調フィルタリング
- 理由
- フォロワー嗜好データが十分に集まら
なくてもある程度のレコメンドが可能
- フォロワー嗜好データが集まれば集ま
るほどレコメンド性能が向上
? フォロワー嗜好データ取得方法
- ランダム紹介ツイートのリツイート情報
レコメンド

レコメンド
? アイテム（論文）間の評価
- 非負値行列因子分解 (NMF) により論文をソフトクラスタリングすることで計算
- D. D. Lee and H. S. Seung Learning the parts of objects by non-negative matrix
factrization, Nature, Vol. 401, No. 6755, pp. 788-791, 1999.
- NMF に利用する行列は論文とタイトル?キーワード?要旨にある単語ベクトル
? ユーザ間の評価
- ユーザがリツイートした論文の集合を元にマッチ率が高いユーザを類似しているユーザと
みなす
アルゴリズム

システム構成
Page 8
フォロー情報
リツイート情報
( デイリー )
ランダムツイート（デイリー）
レコメンドメッセージ（週１）スコアリング
( デイリー )
データ蓄積
( 初回時 )

–システム構成レコメンド
Page 9
① 各種情報取得
フォロー情報
リツイート情報
⑥ レコメンドメッセージ
② リフォロー
④ 論文間のスコアを取得
③ リツイート情報解析
⑤ レコメンド情報生成

実際のアカウント確認
Page 10
https://twitter.com/research_friend

展望
レコメンドアルゴリズムの向上
? 更なるフォロワー嗜好データの取得方法の検討
- フォロワーのプロファイル、ツイート、フォロー情報など
? アルゴリズムの選択とチューニング
- 類似度計算の検討? A/B テスト実施
- 別のアルゴリズムフレームワークの検討? A/B テスト実施
論文?フォロワー嗜好データの統計情報のツイート
チューニング?機能追加
? キーワードごとの論文数?自動ジャンル分類結果を定期的にツイート
? 人気論文?ジャンルあるいはキーワードトレンドを定期的にツイート

終わりに
ご静聴ありがとうございました。
Page 12

狠狠撸

20150309 iscover challange_twitter_bot

More Related Content

20150309 iscover challange_twitter_bot