狠狠撸
Submit Search
Sushi is 何
?
1 like
?
822 views
3
31 00
Follow
厂滨贵罢特徴量を用いて、寿司写真の分类を试してみました。寿司を目的とした社内勉强会のためのネタ発表です。
Read less
Read more
1 of 38
Download now
Download to read offline
More Related Content
Sushi is 何
1.
寿司 is 何
Image Classification Problem
2.
by 3100
3.
寿司とは何か What is
Sushi?
6.
人は寿司をどう認識するのか * 視覚 * 嗅覚
* 触覚 * 味覚
7.
人は寿司をどう認識するのか * 視覚 ← * 嗅覚
* 触覚 * 味覚
9.
常に100%正しい認識とは 限らない
10.
が、まぁまぁ 上手くいっている
11.
コンピュータの場合 I’m sorry
Dave, I’m afraid I can’t do that.
12.
コンピュータは識別は得意 * 同じ画像ファイルかどうかは判断可能
* トリミングや回転をすると難しくなる
13.
コンピュータは認識は苦手 * 似たような画像を探すのはまだ研究途上
* 形状や色、パターンなどを手がかりにする 方法は制限のある環境でしか良い結果が出に くい
14.
コンピュータでの画像認識 * SIFT、HOGなどといった手法を用いて、画像か
ら特徴量を算出する * 得られた特徴量からkNNなどの機械学習によって 似た特徴量で画像を分類する * 良い分類が得られるまでパラメータを調整する
15.
SIFT (http://robwhess.github.io/opensift/)
16.
SIFT (http://robwhess.github.io/opensift/)
17.
SIFT * 画像中の特徴的な点を128次元の特徴量として算
出する * 回転、縮小に強く、雑多な画像の中でも検出可能 * パノラマ写真の合成などで活用
18.
HOG (http://www.di.ens.fr/willow/teaching/recvis09/final_project/)
19.
HOG * 画像を区分分けし、各輝度の勾配方向を算
出する * 画像の中から似た形状を探すのに強い * 自動運転車の車載カメラで人間の識別など
20.
そして突然のブレイクスルー Big brother
is watching you.
21.
Deep Learning ?
大規模ニューラルネットワークを使った画像分類 が2012年の大規模画像認識コンテスト(ILSVRC) で優勝 ? ニューラルネットワークを多層構造にすることで、 人間が獲得している認識と同じ仕組みを目指す ? 2013年以降、ネットワーク巨大化合戦
22.
‘コンピューターは猫がどういうものであるか 人間に教えられること無く、自力で理解し た。’
(Google、脳のシミュレーションで成果……猫を認識 | RBB TODAY http://www.rbbtoday.com/article/2012/06/27/90985.html )
23.
寿司を認識する I’m addicted
to Negi-toro.
24.
Deep Learning ->
Caffeというツールで体験できる -> 理論的枠組の知識が足らずよくわからない -> 専用GPUマシンないと時間かかるらしい -> パス
25.
HOG -> 寿司を検出するのは得意そう
-> 寿司フォーカス写真を作りたいわけではない (顔フォーカスにHOG使えそう) -> 寿司の種類を分類できるか不明 -> パス
26.
SIFT -> 割りと基本(古典的)ぽい
-> golang実装はなかったが、python実装を見つけた -> caltech101(101カテゴリ画像)の分類は精度が良いみたい -> 君に決めた!
27.
デモ My demo
was terrible. I was so young.
28.
実装 * python
with scipy, numpy, vlfeat * flask (for web demo) * flickrpy (for images)
29.
制限など * 今回は身近な16種類の分類
* 各ネタごとに50枚の画像を用意(100枚は時 間的に無理でした) * それでもモデル生成に約半日かかった * 認識精度は約40%。。。
30.
改善点 * 学習用画像数を増やす
* SIFTは色情報を使わない?のだがRGBごと にSIFTを算出する方法があるらしい * nginx使うとかでデモサイトを利用しやすく
31.
画像分类の限界
32.
“It’s 甘エビ!”, she
says. YOU CAN (NOT) REDO.
33.
(今回の)画像分类の限界 * 先に定義されていないものについては語り
得ない * 現実問題として、全世界の事象を認識させ るには、時間も空間も足りない
34.
今後の展望 May the
Force be with you!
35.
やはりDeep Learningか *
Caffeに再挑戦したい * その前にきちんと勉強する必要がありそう * 全然仕事に関係ないぞ、これ。
36.
最近読み始めた本
37.
輪読メンバー絶賛募集してます。 – Fin
38.
参考資料 ? 3日で作る高速特定物体認識システム
(2) SIFT 特徴量の抽出 - 人工知能に関する断創録 ? Caffeで手軽に画像分類 - Yahoo! JAPAN Tech Blog ? ねこと画像処理 part 1 – 素材集め ? Rest Term
Download