狠狠撸
Submit Search
苏宁图像智能分析实践
?
Download as PPTX, PDF
?
1 like
?
301 views
Xiaohu ZHU
Follow
苏宁图像智能分析实践
Read less
Read more
1 of 44
Download now
Downloaded 35 times
More Related Content
苏宁图像智能分析实践
1.
苏宁图像智能分析实践 二〇一六年十月
2.
线上电商 线下店商 图像分析对苏宁的价值
3.
深度学习? 黑科技?无所不能? AlphaGo? 能实现我的什么需求? 公司需求? 商品识别?人脸识别? 需要我的什么技术?
4.
深度学习极大的便利了公司算法应用
5.
内容 3 图像智能分析系统组成及平台介绍 1 2 图像智能分析应用 技术案例: 图像自动标注方法
6.
Part 1 图像智能分析系统 组成及平台介绍
7.
图像智能分析系统组成: 线上应用系统 离线算法平台 智能监控系统
8.
线上应用系统: 应 用 算 法 接 口 数 据 图像算法接口 推荐平台接口 搜索平台接口 图像数据解析
结果整合 数据库管理 拍照购 价签购 人脸分析 Logo购 ... 商品识别 文字识别 人脸分析 目标检测
9.
智能监控系统: 智能分析模块 ...... 门店1 数据通信 客流 人脸 行为 设备管理 数据整合模块 智能分析模块 ...... 门店N 数据通信 客流
人脸 行为 设备管理 数据整合模块 ...... 数据中心 数据库 报表
10.
离线算法平台: 效 果 层 数 据 层 模 型 层 深度学习模型 训练 模型测试验证 特征提取及融合 商品识 别 人脸算 法 OCR 检测算 法 ... 图像获取 图像预处 理 图像标注
传统特征提取 传统模型训练 检索模型
11.
目的: 为不同的应用需求提供一致性的算法接口, 满足各种图像智能分析需求, 为内部和外部用户提供智能分析服务。 图像智能分析平台 功能:
商品识别 Logo检测 人脸分析 OCR应用 ......
13.
Part2 图像智能分析应用
14.
电商公司图像算法应用的特点 1. 产生直接受益(经济上或者业务上),或者能提供关键数据。 2. 有明确的业务场景。 3.
并发量高,对算法时间性能要求高。
15.
拍照购(商品识别):介绍 以商品识别算法和图像检索系统为基础,利用深度神经网络强大的表达能力, 抽取图像中商品的有效特征,并结合文本识别的结果,获取高相关度商品的推 荐结果。 特点: 1. 支持广泛品类的商品识别(今年内基本做到全覆盖)。 2. 与文本识别相结合。 3.
较快的识别与检索速度,相关性较高的返回结果。
16.
拍照购(商品识别):算法系统组成 输入图像 预处理 特征提取 图像检索 文本识别 结果融合
17.
拍照购(商品识别):使用示例
18.
拍照购(商品识别):优化策略 有用策略: 1. 补充数据。增加有效的真实训练样本,提升模型的表达能力,并提高检索 精度。 2. 主体检测。有效检测出图像中商品主体,减少背景的干扰,提升识别精度。
19.
拍照购(商品识别):优化策略
20.
智能门店监控:介绍 目的: 实现门店监控视频的智能分析,以获取准确的客流人数、客流成分组成、 商品热区、顾客滞留分析等丰富的商业数据信息,进而为商业智能系统提供数 据保障。 特点: 1. 能够统计不同环境、不同状态下的客流人数。 2.
能够检测不同环境下人脸,并分析其年龄、性别等信息。 3. 能够得到不同排布商家的商品热区信息。 4. 能够分析顾客的滞留,进而对顾客行为进行判断。
21.
智能门店监控:客流统计 方案: 1. 采用置顶数字摄像头 2. 检测进入区域的人体 3.
跟踪并确认有效客流
22.
智能门店监控:人脸分析 1. 利用特征点跟踪有效估计人脸姿态,利用正面人脸进行去重分析。 2. CNN网络分析年龄及性别。
23.
智能门店监控:顾客行为分析 1. 对于置顶或偏置摄像头,都能够有效获取商品热力图。 2. 对顾客进行去重和滞留分析,能够最大限度抑制销售员影响。 3.
进一步分析顾客与销售员行为。
24.
文本图像识别:介绍 应用: 1. 对价签等丰富文本载体进行分析,得到文本内容。 2. 对自然场景中文本进行识别,辅助物品识别。 技术方案 1.
检测图像中可能的文本区域。 2. 对文本区域进行验证和校正。 3. 迭代寻找最优的切分和识别结果(CNN识别单字)。 4. 利用语言模型进行校正。
25.
文本图像识别:示例
26.
文本图像识别:价签购示例
27.
其他一些应用工作 1. 与人脸相关的促销应用。 -- 颜值检测,萌值检测,速配得分...... 2.
与检测相关的促销应用。 -- Logo检测,商品检测...... 3. 与推荐相关的应用。 -- 找相似,找同款...... 4. 敏感图像检查。
28.
头疼的问题 1. 有效图像样本获取困难,样本不均衡。 2. 噪声样本比例极高,标签缺失。 3.
实际场景变化复杂。 4. 生产环境硬件资源限制。
29.
实践: 一种图像 样本自动标注方 法 Part 3
30.
– 来源 ? 拍照购 ?
图像识别引擎 ? 深度学习 – 需求 ? 海量的已标注图像数据 背景介绍
31.
背景介绍 图像来源 1. 拍摄: 成本太高 2.
商品主图: ps过,与真实场景不符 3. 网络图像: 晒单等。 噪声太严重 需求: 标注出商品图像和噪声图像 难度: 人工标注效率太低
32.
技术现状 1. 学术圈关注度低 2. 很常见的现实问题 可能方案 1.
标注少量数据进行冷启动 标注数据影响结果 2. 半监督学习? 数据太杂乱,不符合一般半监督学习方法的假设 3. 主动学习 Good idea.
33.
技术思路 1. 针对噪声图像多且杂,采用多重过滤 2. 选择合适的无监督聚类方法,自动获得好的聚类中心 3.
利用聚类的结果进行标注,数据量大且分布较为紧凑的聚类极有可能就是 真实样本图像 希望 尽量少人工干预,人工干预对最终结果的影响很小。 效率尽量高,且结果无需迭代式优化。
34.
技术方案 1. 图像采集 2. 重复图片过滤 3.
非商品噪声图片过滤 4. 图像聚类自动标注
35.
End-to-end 数据过滤
36.
无监督聚类方法 常见方法: 1. 基于划分: k均值,
k众数,k中心点, Canopy 2. 基于层次: BIRCH, Chameleon 3. 基于密度: DBSCAN, DENCLUE 4. 基于网格: STING 5. 基于图论: Spectral Clustering 常见问题: 1. 适用范围窄 2. 参数不易设置,对结果影响大 3. 聚类中心选择准则过于简单或过于复杂,适应性差 4. 高维情况下表现不好
37.
无监督聚类方法 Clustering by fast
search and find of density peaks, Alex Rodriguez and Alessandro Laio. 步骤: 1. 聚类中心选择 2. 根据聚类中心进行聚类 特点 1. 基于密度的方法,能够发掘不同形状的聚类,也能很好描述离群点 2. 提出一种寻找最佳聚类中心的新颖方法 3. 形式简单,效率较高 4. 唯一参数需要设定,具有弹性,适用于不同情况
38.
无监督聚类方法: 聚类中心选择 基本思想: 寻找合适的聚类中心,
使其满足 自身的密度大,密度大于它的所有邻居 与其他密度更大的数据点的距离相对更大 定义局部密度 和距离
39.
无监督聚类方法: 聚类中心选择 当聚类个数不能轻易获得时 定义 当??越大时,越可能是聚类中心。
40.
无监督聚类方法: 聚类策略 步骤: 1. 初始化各个聚类,以聚类中心为初始点 2.
根据距离判断其他非中心数据点的类别,将其划分到某一聚类 3. 将每个聚类中的点,进一步划分为核心数据点和边缘数据点 截断距离参数 的选取: 1. 太大的话 太大,区分度太低;反之,会得到细碎的聚类 2. 建议值: 使得每个数据点的平均邻居个数约为数据点总数的1%~2%
41.
无监督聚类方法: 聚类效果
42.
实际效果
43.
总结 目标: 为图像自动打标签,为图像识别引擎准备训练数据 特点: 全过程无需人工干预。 效率很高,和人工标注相比可提高100倍。 效果很好,图像相关度可达95%以上
Download