基于BERT模型的老年人反诈APP设计与实现

期刊: 环球科学 DOI: PDF下载

王文静,高澜菁,颜新桥,刘伊平,刘淑敏,王祖俪

(成都信息工程大学网络空间安全学院,四川成都610225)

摘要

针对老年人群体易成为诈骗目标、传统防诈手段精准度不足且适老性差的问题,设计并实现了一款基于BERT模型的老年人反诈APP。该APP整合自然语言处理与移动开发技术,通过用户反馈机制动态优化模型。实验表明,APP对诈骗信息的识别准确率达89.2%,操作界面贴合老年人使用习惯,能有效提升老年人的反诈能力,为智能反诈领域提供了适老化解决方案。


关键词

老年人反诈;自然语言处理;APP开发

正文


1.引言

随着电信网络技术的快速发展,诈骗手段呈现出智能化、隐蔽化趋势,老年人群体因信息获取渠道有限、技术操作能力较弱,成为诈骗分子的主要目标[1]。据中国互联网络信息中心《第52次中国互联网络发展状况统计报告》显示,我国60岁及以上网民占比达11.2%,但超70%的老年人曾遭遇过电信或网络诈骗,传统防诈手段(如关键词过滤、人工举报)已难以应对翻新的诈骗话术[2]

国务院办公厅印发的《关于切实解决老年人运用智能技术困难的实施方案》明确提出,需开发适老化智能工具,帮助老年人防范诈骗风险[3]。在此背景下,将深度学习技术(如BERT模型)应用于反诈领域,结合适老化设计,成为解决老年人反诈难题的关键路径。

本文采用技术适配-功能实现-优化迭代的研究思路,通过BERT模型优化、适老化交互设计与动态反馈机制构建,实现诈骗信息精准识别与便捷使用的双重目标。本文的核心研究内容包括三部分:

1基于BERT模型的诈骗信息识别模块开发,涵盖短信及网络消息的实时检测;

2适老化交互模块设计,重点为简化操作界面;

3动态优化机制构建,通过用户反馈更新关键词库与模型参数,提升系统适应性。

2.相关技术背景

2.1核心理论基础

2.1.1 BERT模型原理

BERTBidirectional Encoder Representations from Transformers)是一种基于Transformer编码器的预训练语言模型,通过双向上下文语义理解,可捕捉文本中的深层语义关联[7]。与传统关键词匹配或单方向语言模型(如ELMo)相比,BERT能更准确识别冒充亲友借款”“虚假投资推荐等语义复杂的诈骗话术,避免因话术变体导致的漏判。

2.2其他核心技术

(1)后端开发方面

核心技术及工具选用了Python编程语言、Flask轻量级Web框架以及MySQL关系型数据库。这一技术组合的选择主要基于其能够高效支持RESTful API接口的快速开发与部署,同时MySQL作为一种稳定可靠的关系型数据库,能够很好地适配项目中诸如用户黑白名单管理、网络请求拦截记录存储等小体量、结构化数据的持久化需求,兼顾了性能与开发效率。

(2).前端开发环节

采用Flutter作为核心框架,主要考虑到其优秀的跨平台开发能力,能够通过单一代码库同时生成兼容AndroidiOS两大移动操作系统的应用版本。此外,Flutter提供了高度可定制的UI组件和灵活的布局机制,能够针对老年人用户的视觉特点进行界面优化,例如调整字体大小、图标设计和色彩对比度,从而有效提升用户体验与可访问性。

3模型训练部分

技术方案依托PyTorch深度学习框架和Hugging Face Transformers库实现。选择这一组合的原因是,Hugging Face提供了丰富的预训练模型资源,特别是基于BERT的预训练权重,使得项目能够有效利用迁移学习技术,通过在特定数据集上进行参数微调,快速适配实际任务需求,大幅降低从零开始训练模型所需的时间和计算资源。

4数据存储方案

采用了SQLite本地数据库与云服务器MySQL数据库相结合的混合架构。SQLite作为轻量级的嵌入式数据库,保障了应用在无网络环境下的离线可用性;而云端MySQL数据库则承担了关键数据的同步与备份职能,特别是用户黑白名单的多设备实时同步以及拦截记录的历史数据备份,既提升了数据的可靠性,也增强了系统的整体健壮性。

3.APP设计方案

3.1系统总体架构

APP采用前端交互-后端处理-模型服务三层架构:前端交互层:负责用户操作(文本输入、反馈提交)与结果展示(预警提示、拦截记录),界面设计遵循大字体、少按钮、强引导原则;后端处理层:实现数据流转与业务逻辑,包括黑白名单管理、用户反馈记录;模型服务层:部署微调后的BERT模型,接收后端传输的文本数据,返回诈骗风险评分。

3.2核心模块详细设计

APP主要分为短信诈骗识别、电话诈骗识别、黑名单建立、个性化推送、其他功能模块。其中短信诈骗识别主要完成对短信类诈骗的识别功能,电话诈骗识别实现对电话类诈骗的识别功能,黑名单建立可用于构建诈骗相关的黑名单体系,个性化推送能根据用户需求推送相关信息,其他功能则涵盖了APP的其余辅助性功能,功能图如图1所示

3.2.1诈骗信息识别模块

该模块是系统的核心,分为数据预处理、模型推理与结果输出三步骤:

1)数据预处理

文本清洗:去除短信及网络消息中的特殊符号(如表情、乱码),统一文本格式;

分词与编码:使用Jieba分词对中文文本进行处理,再通过BERTTokenizer将文本转换为模型可识别的token

2)模型推理

基于预训练的BERT-base-chinese模型,使用公开诈骗语料(如国家反诈中心公布的案例)与自定义标注数据(采集老年人常见诈骗短信)进行微调;

输出诈骗风险评分,当评分0.6时,触发预警;

3)结果输出

向用户推送预警提示(含诈骗类型,如虚假中奖”“冒充公检法);

将涉诈号码加入黑名单,后续相同号码的信息直接拦截。

 

1诈骗信息识别流程示意图

3.2.2黑名单建立模块

黑名单的建立与管理作为核心模块,旨在构建精准且灵活的黑名单运维机制。

流程始于开始节点,首先收集并录入来自用户、系统监测或其他渠道的反馈结果,这些结果涵盖了潜在黑名单对象的特征与行为数据;基于此,通过规则引擎或人工初步筛选,构建黑名单库。

随后进入关键的手动确认环节,由运维人员对黑名单条目进行逐一核查,判断其是否符合准入标准且无误差;若确认无误,该流程即告结束,黑名单条目正式生效。若存在误判或需优化的情况,则进入调整环节,对黑名单的判定规则、条目信息等进行修正。调整完成后,流程返回至结束环节,从而确保黑名单管理的准确性与动态适应性。

3.2.3动态优化模块

1)用户反馈机制

拦截记录页面提供“误判”和“漏判”两个反馈按钮,用户点击按钮后可以提交详细的补充说明信息(例如,用户可能会填写“该号码是子女的,误拦截”之类的具体解释)

所有的反馈数据会实时同步至云端服务器,每周技术团队会对误判案例进行统一标注整理,这些标注后的数据将用于AI模型的持续微调和优化,以提升拦截准确率。

2)关键词库更新

基于广大用户的反馈信息和已公开的诈骗案例分析,我们持续对关键词库进行动态维护和优化,每月定期更新关键词内容。例如,针对近期出现的“数字人民币诈骗”“AI换脸冒充”等新型诈骗手段,及时添加相应关键词。更新后的关键词库将实时同步至所有用户端,确保每一位用户都能获得最新的防护支持。

3.2.4适老化交互模块

界面简化设计:仅保留首页(检测)”“拦截记录”“反馈三个核心页面,页面切换通过底部大图标导航;文本字体尺寸16px,色彩对比4.5:1(符合《信息无障碍指南》要求)。4.APP实现与测试

4测试效果

4.1数据准备与模型训练

1)数据集构建

公开数据:采集国家反诈中心官网案例、Kaggle诈骗短信数据集;

自定义数据:通过模拟老年人日常接收的短信,标注诈骗与非诈骗样本各2000条;

数据划分:按7:3比例分为训练集(6300条)与测试集(2700条)。

2)模型微调

初始权重:使用bert-base-chinese预训练模型;

训练参数:学习率5e-5,批次大小32,迭代次数10轮,采用交叉熵损失函数;

优化策略:通过早停法(Early Stopping)避免过拟合,当验证集损失连续3轮不下降时停止训练。

4.2测试结果

2-4为系统功能展示图,包括电话预警、短信预警、一键报警等功能,还会推送最新预警信息,如假冒公检法诈骗频发提示。

 

4APP首页5防诈动态展示页面6短信报警功能

5.结论与展望

本文设计并实现的基于BERT模型的老年人反诈APP,达成了预期研究目标:

通过BERT模型的迁移学习与微调,实现了诈骗信息的精准识别,准确率达89.2%,解决了传统关键词匹配的漏判问题;通过简化界面,满足老年人的使用需求,usability测试结果显示用户接受度较高;构建的用户反馈机制,可动态更新模型与关键词库,为系统长期适配新型诈骗手段提供保障。

当然,系统也存在一些局限,例如数据集规模有限:自定义标注的老年人诈骗样本很少;当前模型部署于轻量云服务器,高并发场景下(如节假日诈骗高发期)可能出现响应延迟。

下一步会进行数据扩充,例如与社区、养老机构合作,收集更多老年人真实诈骗案例;通过模型压缩技术(如蒸馏、量化),降低BERT模型体积,实现本地端部署,减少云端依赖;增加防诈知识推送模块,基于用户的拦截记录,推送个性化防诈科普内容(如您近期收到投资类诈骗短信,点击了解防范技巧)。

参考文献

[1]中国互联网络信息中心。第52次中国互联网络发展状况统计报告[R].北京:中国互联网络信息中心,2023.

[2]国务院办公厅。关于切实解决老年人运用智能技术困难的实施方案[Z].北京:国务院办公厅,2020.

[3]国家反诈中心,工业和信息化部反诈中心。反诈预警短信12381服务[EB/OL].https://www.antifraud.gov.cn,2023.

[4]蓝马甲公益平台。老有用了:助老科普网络[EB/OL].https://www.lanmajia.org,2023.

[5]Devlin J,Chang M W,Lee K,et al.BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding[J].arXiv preprint arXiv:1810.04805,2018.

[6]王浩,李娟。基于改进BERT模型的网络诈骗文本检测研究[J].计算机工程与应用,2022,58(11):123-130.

项目受四川省大学生创新创业项目支持(S202510621058,基于BERT模型的老年人反诈小程序的设计)

 


...


阅读全文