狠狠撸

狠狠撸Share a Scribd company logo
M5Stick V で
V-Trainingを試してみた
M5StickVは???
Kendryte K210を搭載したAIカメラです。高性能なニューラル
ネットワークプロセッサ(KPU)とデュアルコア 64 bit RISC-V
CPUを使用しており、低コストかつ高いエネルギー効率で高性
能な画像処理を行うことができます。
(スイッチサイエンスサイトより抜粋)
つまり(ネットに転がっている汎用的なモデルを使って)
缶ドリンクです
缶ドリンクであることを認識
拾った.kmodel
これを???
こうすることができるんですよね?
ストゼロです
ストゼロであることを認識
ストゼロ.kmodel
で、これどうやって作るの?
ストゼロです
ストゼロがストゼロであることを認識
ストゼロ.kmodel
V-Trainingで作れるらしい
M5Stack Docs > M5StickV > QuickStart > V-Training
使ってみた
使ってみたところ、ちょっと面倒
?対象物のみの写真を撮るのが難しい
?1クラスにつき35枚の画像を用意するのが面倒
検証1 任意の画像サイズ
?対象物のみの写真を撮るのが難しい
?1クラスにつき35枚の画像を用意するのが面倒
画像をググって
サムネをキャプチャ
でいけました
(ファイル合計200MB未満)
mkdir .train%1
for /l %%i in (1,1,30) do (
copy %1.jpg .train%1%%i.jpg
)
mkdir .valid%1
for /l %%i in (31,1,35) do (
copy %1.jpg .valid%1%%i.jpg
)
検証2 同じ画像で水増し
?対象物のみの写真を撮るのが難しい
?1クラスにつき35枚の画像を用意するのが面倒
コピペして水増しでいけました
(単純な図形なら割と認識)
うまくいかなかった点
1.アップロードできない???
かなりの頻度で途中で止まります。
時間を改めて何度かトライしました。
2.分類が少なすぎると誤認識が多い
fmap = kpu.forward(task, img, False)
For better result, we recommend to shoot more than 3 Class
(More than 3 recognition object )
と公式にあるので、
とりあえず分類を増やす。
3つ目の引数はsoftmaxで、Trueにすると出力(分類ごとの確からしさのリスト)の合計を
1に正規化する、らしいがFalseでその状態。というかTrueにするとエラーになる。
リストの値が3つの分類の確からしさが [ 0.0, 0.01, 0.09 ] だったとしても [0.0, 0.1, 0.9] に
なってしまうので、これも誤認識しやすい原因の一つかも?
3.複雑なものは誤認識が多い
対応策:情報量を減らしてみる
対応策:対象を分離しやすいようにくり抜いてみる
3.複雑なものは誤認識が多い
対応策:情報量を減らしてみる
対応策:対象を分離しやすいようにくり抜いてみる
試してみる
それまではアップロード後10分くらいで返ってきていましたが、
数日たっても返ってきません???
(試してみた) 結果が返ってこない???
ありがとうございました
付録:検証に使ったデータ 一覧
(1-30がテスト用データ、31-35が検証用データ)
付録:検証に使ったデータ 一覧
(1-30がテスト用データ、31-35が検証用データ)
付録:検証に使ったデータ 一覧
(1-30がテスト用データ、31-35が検証用データ)
付録:検証に使ったデータ 一覧
(1-30がテスト用データ、31-35が検証用データ)

More Related Content

M5Stick V で V-trainingを試してみた