際際滷

際際滷Share a Scribd company logo
^マルチメディアC亠僥 ̄の
函りMみ
Yusuke FUJISAKA, CyberAgent, inc.
徭失B初
¢ 儲梳 v初(ふじさか ゆうすけ)
$ 拍弥h竃附
¢ 室g云何 拍~圻ラボ侭奉
¢ 2012定仟怱秘芙
$ からずっと拍~圻ラボ
¢ _k宛周
$ 碧エンジン
$ ★Content Moderationシステム
$ ★鮫颪修遼JR児P
2
CAのメディアサ`ビス
Q麻Y創よりi 3
CAのメディアサ`ビス
¢ 光サ`ビスとメディアNのvS來
?テキスト/?鮫/?啝 ?啝
?テキスト/?鮫
?啝
?咄S
4
CAのメディアサ`ビス
¢ 光サ`ビスとメディアNのvS來
?テキスト/?鮫/?啝 ?啝
?テキスト/?鮫
?啝
?咄S
¢ 謹N謹なサ`ビスが贋壓
¢ メディアのNも謹N謹
¢ サ`ビスからの勣李も?
$ ひとつの圭隈で盾Qできるわけでもない
5
書までのマルチメディアC亠僥の函りMみ
[サ`ビスイン]
¢ アメブロ鮫颪離テゴライズ
¢ スパム鮫返
[編^粁A]
¢ ピグアバタ`伏撹
¢ マッチングプロフィ`ルu
¢ S爆の腹り貧がり返
[岑R誼]
¢ 畠芙ゼミ★侮嗔Яゼミ
6
プロジェクト1: アメブロ鮫颯テゴライズ(1/4)
[n}]
¢ Ameba巷塀ジャンル https://blogger.ameba.jp/ のカテゴライズを
徭啝したい
★徭隼冱Z盾裂+誘後鮫饅睥
7
プロジェクト1: アメブロ鮫颯テゴライズ(2/4)
[古廷]
〜 300k
+ ?(64)
+? ResNet-18
繁薦による
ラベル原嚥
API
僥
容
?
8
プロジェクト1: アメブロ鮫颯テゴライズ(2/4)
[古廷]
?
+ ?(64)
+?
?
ResNet-18
API
誘後/鮫餝薐
Category
Text classification
テキスト盾裂と
M栽わせてカテゴライズ
〜 300k
9
プロジェクト1: アメブロ鮫颯テゴライズ(3/4)
¢ ラベル原け砿尖ツ`ル(坪u)
10
プロジェクト1: アメブロ鮫颯テゴライズ(4/4)
[Y惚]
¢ 嘔: t-SNE
¢ Top-1 accuracy: 82.73%
$ Top-5: 97.12%
¢ 登隼としないカテゴリもあるが
古ね措挫なY惚
$ プロデュ`サ`箸箸離テゴリの
すり栽わせが駅勣
11
プロジェクト2: スパム鮫返(1/6)
カスタマ`サ`ビスにvわるN?の}を盾Qする
[n}1]
¢ Content moderation(コンテンツ宗畠晒)のシステムも毅輝している
¢ スパム鮫(エログロなど)の奮を徭啝したい
$ 匯違にスパム鮫颪畠誘後鮫颪釦爾瓩觚邵呂0.1%念瘁
$ しかしそのために謹くの鮫颪鰉佝砲妊船Д奪しなければならない
0.15
%
12
[古廷] 1: スパム鮫颯侫ルタ
プロジェクト2: スパム鮫返(2/6)
?
?
? ?
??
ResNet
API
{^score ̄: 0.01234´}
Thresholding
?/?
13
DBOシステム
[古廷] 1: スパム鮫颯侫ルタ
プロジェクト2: スパム鮫返(2/6)
?
?
? ?
?
DB
?
ResNet
?
API
{^score ̄: 0.01234´}
Thresholding
?/?
嗤繁O
4定蛍/s400嵐旦
14
[古廷] 1: スパム鮫颯侫ルタ
プロジェクト2: スパム鮫返(2/6)
?
?
? ?
?
DB
?
ResNet
?
API
{^score ̄: 0.01234´}
Thresholding
?/?
Oオペレ`タのa廁
15
プロジェクト2: スパム鮫返(3/6)
[Y惚]
¢ 嘔: t-SNE SPAM(エログロ)/HAM
$ 登隼としない´
$ スパムと匯笥に冱っても嫌レい
¢ ★デ`タセットの屁笋yしい
¢ ★瘁峰する貌鮫返も聞える
16
プロジェクト2: スパム鮫返(4/6)
[古勣2]
¢ マッチングアプリ吉において、プロフィ`ル鮫颪鯤垢い泙錣好罘`ザを
返したい
$ 並箭1: 匯違繁を_って鞠hし、益芙アプリから麿芙アプリにTГ垢誥
$ 並箭2: |な竃氏い朕議で}方のアカウントをl聞する宀
I宀鮫DB
?
I宀登協に旋喘

17
プロジェクト2: スパム鮫返(5/6)
[古廷] 2: 貌鮫颯侫ルタ
? / ?DB
64肝圷のベクトルにRs
(dhash)
Thresholding
18
プロジェクト2: スパム鮫返(5/6)
[古廷] 2: 貌鮫颯侫ルタ
? / ?DB
Thresholding
ベクトルのHamming鉦xで
貌鮫颪どうか登僅
19
プロジェクト2: スパム鮫返(6/6)
[Y惚]
¢ gYにより、ハミング鉦x=
7 or 8 bitでFラ邊
$ n=17,849
¢ |なI宀のあぶり竃しに
20
プロジェクト3: S爆の腹り貧がり返(1/3)
[n}]
¢ S爆のサビ何蛍を徭咾奮したい
¢ S爆の襖侘秤鵑鮖醵辰垢觀酬┐鯡修
21
Free Planでは
30昼だけ壅伏
プロジェクト3: S爆の腹り貧がり返(2/3)
[古廷]
? 咄Sデ`タ+タグ
? STFT
? 巓襖方業
Decode
? 襖侘 % 竃薦(カテゴリ_楕)
CNN 12
22
プロジェクト3: S爆の腹り貧がり返(2/3)
[古廷]
? 咄Sデ`タ+タグ
? STFT
? 巓襖方業
Decode
? 襖侘 % 竃薦(カテゴリ_楕)
CNN 12
start,0.5564
tempo,108
i,0
c,8
l,40
v,56
b,88
t,104
c,108
l,140
v,156
...
---
タグ〜100爆
23
プロジェクト3: S爆の腹り貧がり返(2/3)
[古廷]
? 咄Sデ`タ+タグ
? STFT
? 巓襖方業
Decode
? 襖侘 % 竃薦(カテゴリ_楕)
CNN 12
24
プロジェクト3: S爆の腹り貧がり返(3/3)
[Y惚]
¢ 3クラス(メロディ?サビ?その麿)の蛍について{
¢ サンプル巓襖方その麿を弼?いじる
¢ ★蛍娼業 51% ?
¢ 互娼業晒したいけど´
Intro Verse Bridge
Inter-
lude
Chorus Verse Bridge Chorus Elision Chorus Outro
25
まとめ?
¢ マルチメディア(麼に鮫?咄Sの)C亠僥のg箭を幣した
¢ 書瘁も揖のC亠僥にする俶勣は阜びていくと深えられる
$ 啝にvわるC亠僥(AbemaTV, FRESH!, OpenREC, etc.)
$ マルチメディア碧
$ 恷仟室gのキャッチアップ
$ 屡贋のレコメンドなどの互娼業晒
$ などなど´
26
Thank you!
27

More Related Content

"マルチメディアC亠僥" の函りMみ

Editor's Notes

  1. こんばんは、謹くの峻にお埆しいただきありがとうございます。 ということで、峻さま拍~さんのおをSしみにされているところかと房いますが、 その念に、暴儲梳のほうから仝マルチメディアC亠僥の函りMみ々というテ`マでおさせていただきたいと房います
  2. まず徭失B初から。 わたくし儲梳ともうします。 益芙室g云何拍~圻ラボに2012定より輩めております。 それで書まで採をしてきたかと賦しますと、秘芙輝兜は碧エンジンの_k、そのあと、コンテントモデレ`ションシステム、コンテントモデレ`ションとはいわゆるスパム誘後であるとか、係恟にvわる誘後を電茅するための、箭えばフィルタリングや繁返によるOといったI佞里海箸鰆犬靴泙后 そして、F壓は、書指おさせていただく、鮫騁JR、あとは鮫颪墨泙蕕災SなどのI尖を佩う、いわゆるマルチメディアC亠僥の児P_kにシフトしてきました。
  3. さて、厘?が侭奉する拍~圻ラボですが、益芙の?な並Iのうち、とりわけ、橿で譴辰織瓮妊ア並Iにして?な室gを戻工するお碧並をしております。 かといって、麿の並Iにまったくvわらない、というわけではないのですが。
  4. それで、そのメディア並Iの光サ`ビスを県遨してていきますと、 アメブロに旗燕されるAmeba並Iは、峻テキストと鮫顱△△箸恷除では啝もつかってブログを誘後していただいています。 それから、AbemaTVですとかFresh!はいわずもがな、啝サ`ビスです。 嘔和のAWAは咄Sサ`ビス、 あと恷瘁にタップルQ伏など、恷除えているマッチングサ`ビスについてはプロフィ`ルのテキストの麿に、云繁を燕すプロフィ`ル鮫颪陵狂紊故勣になっています。
  5. それらメディアサ`ビスとメディアのNのvS來について、蒙罿鬚△欧討いますと、 ?まずは圭鯰圓流なる謹N謹なサ`ビスが贋壓しています。 ?それから、メディアのNもテキストから啝まであります。 ?ゆえに、サ`ビスからの_k勣李も嫌レく、ひとつの圭隈で盾Qできる譴呂修譴曚百鵑くない、ということもあります。
  6. ということで、書までに厘?が函りMんだプロジェクトをgに匯Eにまとめました。 書指はそのうち和を哈いた3つのプロジェクトについて、撹孔?払?ありましたので、ざっくりh苧できればと房います。 その麿のプロジェクトについては、ごd龍がありましたら瘁ほどいていただければと房います。 (pause) よろしいでしょうか、では枠にMみます。
  7. ではまず恷兜のプロジェクトから。 アメブロの光ブログは圷?ユ`ザの徭失賦御のみでジャンルをQめてもらっていましたが、gHの並との行xがあったりしてうまくC嬬していない、という彜rがありました。 それで、恍定ごろより巷塀ジャンルというペ`ジをOけて、光ジャンルことのブログを並を盾裂して、できるだけ徭咾妊献礇鵐觀屬韻靴茲Α△箸いΕ廛蹈献Дトが恠り兵めた、というわけです。 で、そこで誘後された鮫颪盻睥しよう、ということでプロジェクトに歌紗しました。