狠狠撸

狠狠撸Share a Scribd company logo
Twitterにおける
即時話題推定ツール
   えりっくさーとる
     @siritori
こんにちは!
?? あわてんぼうでマイペースな好奇心の
   塊とはわたしのことだ!
?? キャンプ経験者
?? しりとりとマッサージするのとぬい
   ぐるみが好き
?? つくばの情報科学類
蚕.発表って今日ですけど
※わりとすっかり忘れていた
蚕.もしかして、用意してな
    かったの?
耻辫肠补尘辫発表
Twitterにおける
即時話題推定ツール
   えりっくさーとる
     @siritori
Twitter廃人における
 TL監視支援ツール
   えりっくさーとる
     @siritori
Twitter、便利ですよね
?? でもフォロー数多いと
 –? 時間が盗まれる
 –? 疲れる
?? なんとかしていろんな情報をたくさん入れ
   たい、ある程度まとまった状態で。
?? つぶやきの类似度とかによってTLがまと
   められたらうれしいなー
类似度
「つぶやきに
 含まれる
単語の概念の
近さ」と定義
大学で仲間を募って研究開始。
  Twitterにおける
即時話題推定技術の研究
基本的なアイディア:

  つぶやき内の特徴語と、
その親概念と関連概念をもって
   きてそのつぶやきの
    「特徴」とする。
具体的におねがいします
耻辫肠补尘辫発表
耻辫肠补尘辫発表
耻辫肠补尘辫発表
耻辫肠补尘辫発表
Q.親概念とか
関連概念って
どうすんの?
A.困ったときの

Wikipedia
でーたべーすをつくるまで

1.?   MySQLダンプをダウンロード
2.?   csv変換
3.?   Perlちゃんとかで適当にゴミ捨て
4.?   Erlangのetsテーブルに取り込む
おおまかなしくみ

1.?   UserStreamでつぶやき取得
2.?   形態素解析して名詞のみ取り出す
3.?   名詞の親概念/関連概念を引く
4.?   ベクトルとして保存
5.?   ほかのつぶやきと比較、类似度計算
      をして可視化
で、どこまでできてるん?
で、どこまでできてるん?
○ UserStream取得
○ 上位概念と関連概念を取得
?ここまで1つぶやきにつき0.3秒くらい
○ 可視化アルゴリズムの実装
で、こっからさきができてない...
 比較アルゴリズムの開発
 可視化の表示
と、いうわけで

  いい機会だし、
自然言語処理とか
  強い人いたら
 知恵ください!
まさに


機会学習
ご清聴

 ありがとう
ございました

More Related Content

耻辫肠补尘辫発表