基于类别无关RPN的无人考场违禁物品检测研究
摘要
关键词
无人考场;违禁物品检测;少样本目标检测
正文
1.研究背景
无人考场主要依靠高级的图像识别和行为分析功能,以自动检测考生携带的违禁物品。现有方案由于缺少新类别实例的标注信息,导致模型对新类别实例的误识别。为了解决这个问题,本研究提出了基于类别无关RPN的少样本目标检测算法,该算法能显著缓解模型的基类偏置问题,从而提高模型的检测精度。
2基于类别无关RPN的无人考场违禁物品检测算法
2.1任务设定
遵循之前的研究[1][2],本文采用了少样本目标检测的标准问题定义。具体地,令表示整个训练集,表示所有类别。本文的目标是基于数据集训练一个强大的检测器,该检测器能在测试集上表现良好。在新类微调阶段,使用对进行微调,以获得最终模型。能够同时检测基类和新类的实例。
2.2RPN的基类偏置问题分析
在基类预训练阶段,由于缺乏新类别的标注信息,与潜在新类别实例匹配的锚点将被划分为负样本。如果这样的锚点参与了损失计算,RPN的二分类损失会错误地将该锚点归类为背景,从而导致网络的基类偏置问题。本文使用PASCAL VOC数据集的Split1配置,比较了基类预训练后RPN的召回率。结果表明,当IoU阈值设定为0.5时,基类和新类之间的召回率没有显著差异。
表1 基类预训练阶段,RPN对基类和新类实例的召回率对比
阈值 | 0.5 | 0.6 | 0.7 | 0.8 | 0.9 |
bAR@100 | 90.5 | 86.9 | 76.5 | 40.2 | 3.9 |
nAR@100 | 89.5 | 84.1 | 71.5 | 34.6 | 2.9 |
2.3类别无关RPN算法
Faster R-CNN设计的RPN[3]损失由和 两部分组成,分别表示分类损失和回归损失,公式(1)展示了的计算形式。本文创新性提出IoU-ness Loss替换二分类损失。令表示预测的IoU,表示锚点与其匹配的真实框之间的IoU值,IoU-ness Loss采用Smooth L1损失,计算公式如下:
3 实验结果
3.1 实验设置
3.1.1数据集
本文在计算机视觉领域广泛使用的PASCAL VOC和MS-COCO两个基准数据集上测试所提算法的有效性。为了保持与现有工作的公平对比,本文采用了TFA[1]提供的数据切分方案。
平均精度(mean Average Precision,)是一个衡量目标检测算法性能的重要标准。
3.2实验结果
3.2.1PASCAL VOC数据集
表2 在PASCAL VOC数据上不同算法对新类别的检测结果对比(以衡量)
划分 | Split1 | Split2 | Split3 | ||||||
K值 | 1 | 5 | 10 | 1 | 5 | 10 | 1 | 5 | 10 |
TIP | 27.7 | 50.2 | 59.6 | 22.7 | 40.9 | 46.9 | 21.7 | 44.5 | 40.9 |
FCT | 38.5 | 59.8 | 64.3 | 25.9 | 44.9 | 47.4 | 34.7 | 53.1 | 56.3 |
TFA | 39.8 | 55.7 | 56.0 | 23.5 | 35.1 | 39.1 | 30.8 | 49.5 | 49.8 |
DeFRCN | 53.6 | 64.1 | 60.8 | 30.1 | 53.3 | 47.9 | 48.4 | 54.9 | 57.4 |
DCFS | 56.6 | 65.6 | 62.5 | 29.7 | 48.9 | 48.1 | 47.9 | 56.1 | 59.4 |
本文方法 | 54.7 | 66.5 | 66.3 | 33.1 | 51.2 | 52.8 | 49.9 | 59.7 | 61.6 |
表2展示了PASCAL VOC数据集3种不同的新类别划分方式,5种不同的值设定下的结果对比,本文的方法在大多数设定下都达到了最优性能。
3.2.2MS-COCO数据集
表3 在MSCOCO数据上不同算法对新类别的检测结果对比(以衡量)
K值 | 10 | 30 |
TIP | 16.3 | 18.3 |
FCT | 15.3 | 20.2 |
TFA | 10.0 | 13.7 |
DeFRCN | 18.5 | 22.6 |
DCFS | 19.5 | 22.7 |
本文方法 | 18.6 | 23.0 |
表3展示了MS-COCO数据集上的检测精度。相较PASCAL VOC数据集,本文的方法在MS-COCO上取得的性能提升并不显著,但仍然可与当前的最优方法相媲美。
4 结论
本研究从RPN的角度重新评估了FSOD中基类偏置的问题,并发现RPN的二分类损失具有类别感知能力,这在基础预训练阶段导致了严重的基类偏置。本研究提出了无分类RPN网络,该网络用回归损失替换了RPN的二分类损失,并调整了损失计算中正负样本的比例。这种方法缓解了RPN将新类别实例视为背景的问题。
参考文献:
[1]张素洁,赵怀慈.最优聚类个数和初始聚类中心点选取算法研究[J].计算机应用研究.2017,(6).
[2]郭鸣宇,刘实.YOLOv3图像识别跟踪算法的优化与实现[J].电子测试.2019,(15).
[3]徐草草,杨启明,张双.基于人脸识别技术的自动安检系统设计[J].计算机与数字工程.2019,(8).
...