基于机器学习的行人图像识别系统

期刊: 环球科学 DOI: PDF下载

周娟1 王旭1 刘金涛2 祁紫霞1 郭佳诚​1

西南科技大学国防科技学院 四川绵阳 621010

摘要

有监督场景下的学习无法将行人重识别模型泛化到其他场景下。该系统通过利用计算机视觉相关技术寻找图像库或视频序列中特定行人,即给定感兴趣的行人,从其他多个监控摄像头数据或者图片中对给定行人进行目标检索。利用计算机视觉算法对某个行人进行跨摄像头的追踪。使用动态测量进行伪标签数量的选取,对未标注数据的伪标签进行就近有标注样本分配,通过对数据集进行跨摄像头风格的数据迁移,使原单标注数据集变为K倍,提高对未标注数据的利用。使用 Cross-entropy损失优化真实图片和生成图片部分数据,提高单样本少标注下的机器学习效率。实现监督场景下的行人重识别。


关键词

弱监督场景;行人重识;跨摄像头;未标注数据利用

正文


引言

警察在搜寻犯罪嫌疑人时,会调监控来侦查。在此过程中会遇到很多困难。第一,警察靠人眼来进行辨别,效率低且准确率低;第二,嫌疑人会进行伪装,戴帽子口罩来遮挡,增大辨别难度;第三,监控设备并没有实现全地域普及,并且其清晰度还有待提高。因此研究弱监督学习的行人重识别对于减少公共危险发生和提高刑侦抓捕效率有着重要社会意义。以弱监督学习作为算法依据,能够有效提高行人识别效率和削减人力物力成本,特别对警方追踪打击罪犯,人流量密集场合的安全检查等方面起到卓越成效。弱监督场景下的少标记学习,可以帮助行人重识别系统适用于更广的场景。从国内外研究现状来看,弱监督行人重识别领域的技术逐渐趋于成熟,均表现出对于初始数据的重视,且具有两点优势: 首先,与外界交互隔离开来,其次,可以自发性地使用未标记数据。

1 研究目

1.1 通过图像风格迁移原理有效地解决普通单样本标注的图片不具代表性的问题

1.2 通过研究自步学习迭代模型的参数降低标注成本过高的问题

 

2 技术方法

2.1 基于跨摄像头风格迁移的数据集扩充与新生

于相同数据集,通过CycleGAN进行多个摄像头图像风格的改变。对含标签图片扩大其数据基数,使其训练图片的摄像头风格得到扩充,对象由先前的单一转为多个。基于原始累积与摄像头风格改变共同构成的数据集单标注点展开对CNN的模型训练。

2.2 跨摄像头风格图片迁移后的数据集标注

在实现跨摄像头风格图片改变后,把全部图片向原始与风格迁移两方向分至图片数据集后据要求设置为两配对的含标签数据集。并跟据来源将图片区别为原始与生成后设置两不配对的非标签数据集,不配对的非标签数据集除输入以外,不含标签。对经过原始累积与跨摄像头风格改变两类处理方式的图片数据集添加伪标签标记,通过初始标记数据的训练,基于卷积神经网络模型进行测算得出其身份标签。在数据集标注时采用包级标签,即对给定的多个小的图像集作标注,并采用弱标注。弱标注可提供行人之间的特征依赖性,对迁移后的跨摄像头风格图片进行数据集标注。

3 研究路线

3.1 标签数据集中的数据优化

为实现高效利用标签数据集,通过跨摄像头风格改变及渐进自学单点两学习过程中进行数据优化。包括对标注数据集进行的交叉熵损失法,跨摄像头风格改变的数据集的K倍扩大法。其中Cross-entropy损失法实现真实与生成两种来源图片的某块数据的优化,提高累积训练中非标记数据的运用率。

3.2 训练伪标签的选取和分配

针对伪标签的数量进行动态测取。重复训练的过程中,起初对少数伪标签进行数据选择,随着训练重复次数的递增渐渐提高伪标签数据量基数,每次比前一次训练造成的样本改变越小,所选的模型越佳。针对非标记伪标签的分配,把距每个非标记样本最近的含标记的样本类型识别成伪标签并给予它,再把其间距定义为标签估计的置信度。

4 结论

通过图像风格迁移原理有效地解决普通单样本标注的图片不具代表性的问题,通过研究自步学习迭代模型的参数降低标注成本过高的问题,我们就能利用有效的监督信息能充分利用未标注的数据来进行识别判断,即实现弱监督学习的行人重识别。二值掩膜是该系统使用的一种空间注意力机制,可以辅助模型提取感兴趣的区域将完整图像分为背景和行人身体区域两部分。该系统的创新点在于渐进式自学习的单样本行人重识别,是一个新的高效利用未标注数据的方法。该系统适用于人流量密集场合的安全检查,以及帮助警方追踪打击罪犯。

参考文献:

[1] 吴越,董兰芳.基于弱监督学习的三维人脸形状与纹理重建[J].计算机系统应用,2020,29(11):183-189.

[2] 毋立芳汪敏贵简萌.一种基于多示例学习的运动员检测方法[J].信号处理,2020,36(09):1399-1406.

[3] Jingyi Feng,Haifeng Wu,Yu Zeng, et al. Weakly supervised learning in neural encoding for the position of the moving finger of a macaque[J]. Cognitive Computation,2020,12.

基金资助:西南科技大学创新基金精准资助专项,编号:JZ23-027


...


阅读全文