基于类别无关RPN的无人考场违禁物品检测研究

期刊: 环球科学 DOI: PDF下载

江浩仁

中核国电漳州能源有限公司,福建 漳州 363300

摘要

无人考场通过高级的图像识别和行为分析实现远程监考。在仅有少量标注训练数据的前提下,提升检测系统的准确率和鲁棒性成为关键问题。本研究提出了一种简单而有效的无分类RPN算法,将RPN的二分类损失替换为平滑损失,并调整了计算损失时正负样本的比例,从而缓解基类偏置问题。


关键词

无人考场;违禁物品检测;少样本目标检测

正文


1.研究背景

无人考场主要依靠高级的图像识别和行为分析功能,以自动检测考生携带的违禁物品。现有方案由于缺少新类别实例的标注信息,导致模型对新类别实例的误识别。为了解决这个问题,本研究提出了基于类别无关RPN的少样本目标检测算法,该算法能显著缓解模型的基类偏置问题,从而提高模型的检测精度。

2基于类别无关RPN的无人考场违禁物品检测算法

2.1任务设定

遵循之前的研究[1][2],本文采用了少样本目标检测的标准问题定义。具体地,令表示整个训练集,表示所有类别。本文的目标是基于数据集训练一个强大的检测器,该检测器能在测试集上表现良好。在新类微调阶段,使用进行微调,以获得最终模型能够同时检测基类和新类的实例。

2.2RPN的基类偏置问题分析

在基类预训练阶段,由于缺乏新类别的标注信息,与潜在新类别实例匹配的锚点将被划分为负样本。如果这样的锚点参与了损失计算,RPN的二分类损失会错误地将该锚点归类为背景,从而导致网络的基类偏置问题。本文使用PASCAL VOC数据集的Split1配置,比较了基类预训练后RPN的召回率。结果表明,当IoU阈值设定为0.5时,基类和新类之间的召回率没有显著差异。

1 基类预训练阶段,RPN对基类和新类实例的召回率对比

阈值

0.5

0.6

0.7

0.8

0.9

bAR@100

90.5

86.9

76.5

40.2

3.9

nAR@100

89.5

84.1

71.5

34.6

2.9

2.3类别无关RPN算法

2.3.1IoU-ness Loss模块

Faster R-CNN设计的RPN[3]损失由 两部分组成,分别表示分类损失和回归损失,公式(1)展示了的计算形式。本文创新性提出IoU-ness Loss替换二分类损失。令表示预测的IoU表示锚点与其匹配的真实框之间的IoU值,IoU-ness Loss采用Smooth L1损失,计算公式如下:

 

3 实验结果

3.1 实验设置

3.1.1数据集

本文在计算机视觉领域广泛使用的PASCAL VOC和MS-COCO两个基准数据集上测试所提算法的有效性。为了保持与现有工作的公平对比,本文采用了TFA[1]提供的数据切分方案。

3.1.2评价指标

平均精度(mean Average Precision,)是一个衡量目标检测算法性能的重要标准。

3.2实验结果

3.2.1PASCAL VOC数据集

2 在PASCAL VOC数据上不同算法对新类别的检测结果对比(以衡量)

划分

Split1

Split2

Split3

K值

1

5

10

1

5

10

1

5

10

TIP

27.7

50.2

59.6

22.7

40.9

46.9

21.7

44.5

40.9

FCT

38.5

59.8

64.3

25.9

44.9

47.4

34.7

53.1

56.3

TFA

39.8

55.7

56.0

23.5

35.1

39.1

30.8

49.5

49.8

DeFRCN

53.6

64.1

60.8

30.1

53.3

47.9

48.4

54.9

57.4

DCFS

56.6

65.6

62.5

29.7

48.9

48.1

47.9

56.1

59.4

本文方法

54.7

66.5

66.3

33.1

51.2

52.8

49.9

59.7

61.6

2展示了PASCAL VOC数据集3种不同的新类别划分方式,5种不同的值设定下的结果对比,本文的方法在大多数设定下都达到了最优性能。

3.2.2MS-COCO数据集

3 在MSCOCO数据上不同算法对新类别的检测结果对比(以衡量)

K值

10

30

TIP

16.3

18.3

FCT

15.3

20.2

TFA

10.0

13.7

DeFRCN

18.5

22.6

DCFS

19.5

22.7

本文方法

18.6

23.0

3展示了MS-COCO数据集上的检测精度。相较PASCAL VOC数据集,本文的方法在MS-COCO上取得的性能提升并不显著,但仍然可与当前的最优方法相媲美。

4 结论

本研究从RPN的角度重新评估了FSOD中基类偏置的问题,并发现RPN的二分类损失具有类别感知能力,这在基础预训练阶段导致了严重的基类偏置。本研究提出了无分类RPN网络,该网络用回归损失替换了RPN的二分类损失,并调整了损失计算中正负样本的比例。这种方法缓解了RPN将新类别实例视为背景的问题。

参考文献:

[1]张素洁,赵怀慈.最优聚类个数和初始聚类中心点选取算法研究[J].计算机应用研究.2017,(6).

[2]郭鸣宇,刘实.YOLOv3图像识别跟踪算法的优化与实现[J].电子测试.2019,(15).

[3]徐草草,杨启明,张双.基于人脸识别技术的自动安检系统设计[J].计算机与数字工程.2019,(8).

 


...


阅读全文