计算机数据挖掘技术的开发问题探微

期刊: 环球科学 2023年第16期 DOI: PDF下载

杨洁

南昌大学共青学院江西省九江市 332020

摘要

现代化科学信息技术发展速度极快，计算机领域日益扩增，计算机和人类生产生活联系日益密切，计算机数据挖掘技术是以统计学原理、大数据、计算机技术等诸多学科实现交叉融合形成的一种现代化技术，发展时间相对偏短，但速度极为惊人。文章主要针对计算机数据挖掘技术在开发层面展开探讨，首先阐述了主要开发技术，其次论述了一系列开发问题，以供参考。

关键词

计算机数据挖掘；数据挖掘技术；技术开发

正文

前言：近年来，计算机数据挖掘技术在诸多领域得到了大范围的应用和推广，发展程度逐渐提升，可以更为高效地解决经营、生产等诸多环节的管理性问题，持续满足现代化社会对计算机技术提出的各种多样化要求，需求增加的同时，在开发角度随之面临一定的挑战与问题。由此，针对计算机数据挖掘技术在开发环节的问题展开深层次探讨，就当前现状而言，拥有极为重要的现实价值。

1 计算机数据挖掘技术在开发环节应用的主要技术

1.1 关联规则

关联规则隶属于实用性质的分析规则，可以对于事物规律、事物模式、事物属性实行描述操作，在数据挖掘中属于技术成熟度较高的一类。在数据挖掘领域中，关联规则在应用层面的价值极为明显，可以掌控数据的规律，单一因变量不会对其形成任何限制。大多数关联规则中的挖掘算法，能够找到挖掘数据中潜藏的关联性，但不是所有关联属性都在应用层面具备一定的价值，必须保证评估工作的合理性，对关联规则中价值较高的规则实行筛选操作。

1.2 支持向量机

伴随统计学习理论持续迭代更新，支持向量机应运而生，隶属于一种崭新的机器学习方式。以结构风险最低原则为基础，强化学习层面的泛化性，同时在精准、分类、推广等层面的性能极为优越，可以对学习问题实行合理处理，构成RBF神经网络、多项式神经网络、训练多层感知器等。与此同时，支持向量法隶属于凸优化问题的一类，局部最优解即为全局的最优解，上述特征属于神经元网络算法在应用层面无法与之比拟的特性。在数据挖掘、数据分类、数据回归、未归事物探索中，对支持向量级可以予以科学应用。

1.3 粗糙集

当数据知识匮乏时，粗糙集可以对数据类别划分能力予以高效考察，对存在模糊性、不确定性的数据实现处理和分析。在数据库的体系中对粗糙集实现科学运用，能够及时找到类别划分的规则，根据数据库的属性实行划分，将其刻画为结论属性和条件属性。对于数据库内部的各种元组来讲，依据不同属性数值对其实行划分，划分出与之相对应的各个子集，具体分为结论属性和条件属性，由此形成判定原则。基于此，拥有相似对象的集合，可以将其统称为初等结合，并当作知识构成的主要成分。针对初等集合执行集合合并操作，并将其归纳到精确集合中，通过整理操作，将其规划到粗糙集。不同粗糙集在边界层面存在的元素存在不同差异，不可将其划分到集合元素一类，也不能将其当作集合元素中的各种补充元素。在数据挖掘领域执行类别划分操作时，可以对粗糙集理论予以一定应用，优势是可以及时觉察出现异常和噪声问题的数据其内部的实际结构^[1]。

2 计算机数据挖掘技术在开发阶段面临的主要问题探讨

2.1 技术实践问题

计算机挖掘技术在以新建完成的网页为对象时，因为新建网页用户体量相对偏少，执行数据挖掘操作时，会将其自动归类到不重要的一类，但诸多旧网页由于前期用户基数体量极为庞大，在数据执行挖掘操作，极易将其归纳到重要一类。网页页面在执行载入操作期间，检索耗费的过程，主要是指用户发送指令到网页最终显示内容需要的具体时间，时间长短对网站在应用时的性能会起到直接影响。网页页面载入时间如若偏长，用户会失去兴趣，直接放弃此次访问操作，数据挖掘技术在应用环节极易产生错误评估现象。就搜索引擎在返回结果层面的显示而言，在返回时每次点击选择，都属于对网页价值实行评判的一种标准，但该方式并不合理，数据挖掘技术在网页中对数据实行分析时失误率极高，易致使数据产生精准性的交叉现象，导致无法判断数据的真实性与否。

2.2 开发算法的性能问题

为了确保计算机挖掘技术在数据库中可以高效科学的针对数据完成提取操作，需要让技术在可伸缩性、有效性等层面的性能得到高效保证，亦是数据精准性得以保证的前提。简单来讲，在大数据库中对数据挖掘技术予以应用时，务必对算法时间做好可预计操作，且确保时间处在可接受区间，就数据库角度而言，上述两项特征是确保数据挖掘操作能达成真正目标的核心要素。当前，大部分数据库自身储存容量较为庞大，内部分布的数据极为广泛，以数据挖掘的计算方法对各类数据实行类别划分，划分完成后分类，对其实行科学处理操作，最终实现整合分析。

与此同时，数据库在执行更新操作时，与增量算法实现有机融合，就不会重新针对所有数据执行挖掘操作，该方式可以以循序渐进的方式，针对数据库中的数据信息完成逐次更新操作，可以直接在已经被挖掘的数据信息上完成强化操作，但该过程所需成本较为昂贵^[2]。

2.3 数据库的多样性问题

当前，关系数据库应用范围日益扩大，以关系数据库为对象，需要保证开发工作的针对性，方可确保数据挖掘系统的需求。当前，诸多其他类型的数据库内部，数据存在多样化的特征，例如空间数据、时间数据、多媒体数据等，数据种类较为多样，且与数据挖掘的真正目标存在一定差别，如果想利用单一系统针对所有数据完成挖掘操作，如同天方夜谭。针对类型不同的数据执行挖掘操作期间，需保证数据挖掘系统具备一定的特殊性。目前，在计算机网络体系中，就广域网和局域网来讲，两种网络数据源在连接层面并非单一的，而是利用多个数据源完成连接操作，共同组成庞大且涵盖数据种类不同的数据库。利用不同数据源针对数据执行挖掘操作，随之对当前的数据挖掘技术在开发层面提出了崭新的挑战。

2.4 挖掘方式以及用户交互的问题

用户不同兴趣内容必然不同，数据挖掘技术需要针对数据实现范围更为广阔的覆盖，并在覆盖期间逐渐发现任务，对数据执行分析操作时，通过多样性的分析方式完成相应操作，但任务需要以不同的形式针对相同数据库完成应用操作，由此亟待提高数据挖掘技术在具体执行挖掘操作时的实际覆盖区域。

与此同时，在数据库中对所挖掘到的内容要想实现精准性把控难度极高，由此数据挖掘技术在具体操作时，需要高度重视交互性能，以交流互动的方式对数据完成探究操作。数据挖掘环节，该种交互方式要以尊重用户的个性化需求为前提，聚焦各种探索需求，按照数据反馈的实际结果，对数据实现精准提炼和挖掘。在遭遇一些特殊状况时，亦可利用交互的形式对数据完成交叉性的分析。对于计算机数据挖掘方式以及交互两种层面面临的问题，可以利用角度和粒度不同的方式分别着手对数据执行观察操作^[3]。

结束语：综上所述，现代化经济发展速度极快，各行各业对于数据信息的依赖度疯狂攀升，数据挖掘技术在开发和应用层面的价值日益提升。数据挖掘技术对诸多领域和行业的发展会起到直接影响，在不同领域会发挥不同价值。对其在开发阶段面临的问题展开深入的探讨，有助于为技术发展与创新提供更为科学可靠的建议，推动技术开发水准迈上崭新的台阶。

参考文献：

[1]黄细标.网络安全中计算机文本信息挖掘技术研究[J].长江信息通信,2023,36(09):121-123.

[2]马艮娟,刘梅.大数据在计算机软件工程中的应用探讨[J].软件,2023,44(09):162-164.

[3]曹纪磊.数据挖掘技术在网络故障诊断中的安全应用[J].网络空间安全,2023,14(04):127-130+140.

...

阅读全文