狠狠撸

狠狠撸Share a Scribd company logo
クラメソさっぽろ IT 勉強会 ( 仮 )
2024.09.28
最近、ショッピングセンターとかの駐車場で見かける「自動でナンバープレートを認識して決算
するやつ」
↑ これ、作ってみました。
YOLO による物体検出モデルをファインチューニングして、カメラに写った車両のナンバープ
レートを検出し、 AI-OCR で数字等を読み取る手順を紹介させて頂きます。必要となった大量の
データセットは全部プログラムで自動生成してます。
自己紹介
平内真一( SIN)
クラスメソッド(株)製造ビジネステクノロ
ジー部
Iot 関連のサーバーサイドエンジニア
アジェンダ
? 無人の駐車場精算
? 機械学习(物体検出?ファインチューニング)
? AI-OCR
? 改善
ナンバープレート認識 - 駐車場精算システム
スマートパーク https://www.pitdesign.jp/smartpark/
ナンバープレート認識
スマートパーク https://www.pitdesign.jp/smartpark/
深層学习 - ファインチューニング
6
https://pjreddie.com/darknet/yolo/#google_vignette
深層学习 - ファインチューニング
深層学习 - ファインチューニング
深層学习 - ファインチューニング
データセット作成
学习
推论
深層学习 - ファインチューニング
アノテーション
普通乗用車 ,x1,y1,x2,y2
業務用軽自動車 ,x3,y3,x4,y4
データセット - プログラムによるナンバープレート生成
データセット –プログラムによるナンバープレート生成
テキスト 1
テキスト 2
テキスト 3
テキスト 4
データセット - 合成 ( 画像 30,000 枚 アノテーション 192,000 個 )
テキスト 1
テキスト 2
テキスト 3
テキスト 4
データセット - 合成 ( 画像 30,000 枚 アノテーション 192,000 個 )
データセット YOLO 形式
学习 - Jetson AGX Orin
学习 小一時間
学习
推论
推论
AI-OCR Azure AI Vision 3.2 GA Read API
https://learn.microsoft.com/ja-jp/azure/ai-services/computer-vision/how-to/call-read-api
AI-OCR そのまま読み込むと、比較的、誤認識が目立ってしまう
AI-OCR 3箇所を別に読み込ませる?業務用はネガポジ?グレースケール変換
最近、ショッピングセンターとかの驻车场で见かける「自动でナンバープレートを认识して决算するやつ」←これ、作ってみました
改善(複数の画像を撮影して、多数決による補正)
札幌 33 ( 87-24
札幌 33 く 87-24
札幌 33 く 87-24
札幌 33 く 87-24
札幌 33 く 87-24
札幌 33 く 87-24
恐らく誤検出
として破棄
改善(矩形変形処理をして、検出范囲を补正)
改善( OCR のファインチューニング)
https://learnopencv.com/fine-tuning-trocr-
training-trocr-to-recognize-curved-text/
改善( Tesseract OCR 単語リスト)
https://qiita.com/kaseki/items/4eae71d7dfa773cda4e5
ご清聴ありがとうございました
YOLOv8 でナンバープレートを検出して AI-OCR で読み
取ってみました。 ?ファインチューニングに使用した
データは、撮影した写真ではなく、 Python で生成した
画像( 30,000 枚? 192,000 アノテーション)です?
https://dev.classmethod.jp/articles/detect_number_plate/

More Related Content

最近、ショッピングセンターとかの驻车场で见かける「自动でナンバープレートを认识して决算するやつ」←これ、作ってみました