学科分类
/ 25
500 个结果
  • 简介:聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的聚类算法.本文提出了一种基于kNN的聚类算法k-NearestNeighborCluster(kNNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到聚类效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚类簇数,它可以大致的找到聚类的簇数.

  • 标签: KNN算法 K-MEANS算法 聚类分析 微博文本聚类
  • 简介:本文阐述了一个网页自动分类系统的设计和实现。设计了一种有效的网页噪音数据过滤算法,并针对kNN算法的主要缺陷进行了改进,提出一种基于中心文本的kNN算法,通过中心文本的获取提高了算法的效率。实验结果表明这两种算法可以改善分类系统的性能。

  • 标签: 网页分类 网页噪音 中心文本
  • 简介:摘要院分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。KNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法在训练样本的分布不均匀时会造成分类准确率的下降。针对KNN方法存在的这个问题,本文提出了一种基于相对距离的KNN分类方法,这种方法减少了边界点处测试样本的误判。实验结果显示,这种方法具有很好的性能。

  • 标签: 院KNN 相对距离 准确率
  • 简介:摘要:知识产权是权利人对所创作的智力劳动成果所享有的财产权利,其本质核心就是为了证明是谁在什么时 间创作了什么样的劳动成果。但由于传统登记方式的局限性,一直存在存证难、取证 难、确权难、维权难、交易难、成本高及周期长等诸多问题。为了解决上述知识产权存在的诸多难题,提出利用人工智能+区块链构建知 识产权溯源平台。该平台一方面对人工智能纹理识别技术进行研究,用于对数据资产提取高维特征向量,将高维特征向量作为证据上传到平台,解决自动化存证和取证的问题;另一方面将通过纹理技术取 证的信息以NFT智能合约的方式放到区块链上,以期解决知识产权维权难、交易难及周期长的问题,利用NFT智能合约也可 以将证据在多个涉及到产权的部门间可信自动化流转。

  • 标签: LBP和KNN融合 人工智能纹理识别 知识产权
  • 简介:摘要:随着国民经济的快速发展,无论是工业生产还是人们的日常生活,对电能的供给质量有了全新的要求。汽轮机作为现代火电厂的关键设备,其良好的运行状态是保障电能正常供给的有力基础,但实际的工作当中,汽轮机常出现各种故障,为工业生产和人们的生活带来了很大的影响。火电厂汽轮机轴承故障诊断方法直接对故障特征指标进行选取,却未对故障特征进行分类,造成传统方法识别精度低。通过火电厂汽轮机轴承故障信号数据,基于提取火电厂汽轮机轴承故障特征,引入 KNN 算法,通过 SVM 改进该算法,构建故障诊断方法。该方法以提取的特征数据为输入,输出故障诊断结果,实现火电厂汽轮机轴承故障诊断。

  • 标签: 火电厂 汽轮机 轴承故障  
  • 简介:Manyalgorithmshavebeenimplementedfortheproblemofdocumentcategorization.ThemajorityworkinthisareawasachievedforEnglishtext,whileaveryfewapproacheshavebeenintroducedfortheArabictext.ThenatureofArabictextisdifferentfromthatoftheEnglishtextandthepreprocessingoftheArabictextismorechallenging.ThisisduetoArabiclanguageisahighlyinflectionalandderivationallanguagethatmakesdocumentminingahardandcomplextask.Inthispaper,wepresentanAutomaticArabicdocumentsclassificationsystembasedonkNNalgorithm.Also,wedevelopanapproachtosolvekeywordsextractionandreductionproblemsbyusingDocumentFrequency(DF)thresholdmethod.TheresultsindicatethattheabilityofthekNNtodealwithArabictextoutperformstheotherexistingsystems.Theproposedsystemreached0.95micro-recallscoreswith850Arabictextsin6differentcategories.

  • 标签: ARABIC DOCUMENTS classification KNN VECTOR model
  • 简介:社会风险分类是为社会风险感觉的一个基本、复杂的问题。进行社会风险分类,Tianya论坛帖子作为数据来源,和四种代表被选择:字符串表示,术语频率表示,TF-IDF表示和BBS帖子的分布式的表示被使用。用作为距离度量标准编辑距离或余弦类似,四个k近邻居(kNN)分类器基于不同代表被开发并且比较。由于词顺序的优先级和神经网络模型段向量的语义抽取,kNN为社会风险分类由段向量(kNN-PV)表演有效性基于分布式的表示产生了。而且,通过不同重量,kNN-PV作为一个整体模型与另外的三个kNN分类器被相结合改进社会风险分类的表演。通过蛮力格子搜索方法,最佳的重量被分到不同kNN分类器。与kNN-PV相比,试验性的结果表明整体方法的Macro-F显著地为社会风险分类被改进。

  • 标签: KNN算法 分类器集成 社会风险 风险分类 神经网络模型 FORUM
  • 简介:摘要:随着大数据和人工智能的迅速发展,对共享单车数据的研究和分析也日益受到关注。为了更好地理解和预测共享单车的使用情况,引入K Nearest Neighbors算法对共享单车数据进行调度路径研究具有研究价值。通过Python和Folium,我们可以对共享单车大型数据集进行分析和可视化。将共享单车轨迹数据订单和停车点数据相结合,可以更全面地了解用户骑行行为和需求。通过分析和预测调度路线,来量化早高峰对共享单车骑行情况的影响。通过上述工作,我们可以对共享单车的使用进行预测和规划,从而为保障共享单车更好地为用户服务提供重要的理论基础。这种方法不仅可以提高共享单车的利用效率,还可以为用户提供更好的骑行体验。因此,具有很好的应用价值。

  • 标签: 大数据 数据分析 共享单车 数据可视化 机器学习
  • 简介:在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。

  • 标签: KNN VSM TableKNN 文本自动分类
  • 简介:摘要随着科技日新月异的发展,验证码技术在网络防护和信息安全方面有着广泛的应用。由于网络攻击手段的提升,验证码技术也在改进。本文采用的教务系统验证码是当前网络中最普遍的字符验证码类型,它多元化的背景噪音和字符扭曲粘连的特点,使得验证码很难实现程序自动识别。针对这些特点,本文在背景去噪阶段,提出RGB三原色去噪法;在单个字符切割阶段,采用轮廓差投影法与水滴算法相结合的分割方法。最后得到所有字符模型,再利用KNN算法,进行字符识别,从而得到识别结果。

  • 标签: 验证码 图像二值化 图像分割 KNN
  • 简介:摘 要:风力发电目前进入了快速发展阶段,对风电功率的精准预测能够很大程度上的缓解风力发电对电网的冲击。现有研究主要以单个目标机组的时间序列数据进行研究,而没有考虑到风电机组的空间相关性。本文利用KNN算法筛选目标机组的空间相关因素,截取欧式距离计算的前K个邻近空间相关机组,再选取LSTM网络模型,提出一种同时考虑了时空特征的KNN-LSTM短期风电功率预测模型。以湖南省某风电场的历史发电数据和气象数据为样本,先将样本数据进行预处理,然后划分为训练集和测试集对模型进行训练和验证。结果表明:KNN-LSTM模型相较于支持向量机(SVM)和传统LSTM等其他模型,误差评价指标MAE和RMSE都有不同程度的下降。证明本文所提出的KNN-LSTM模型的预测精度更高,验证了模型的实用性。

  • 标签: 风力发电 KNN算法 LSTM循环神经网络 空间相关性
  • 简介:摘要:近年来社会用电需求的不断增大,电力工程建设数量也逐渐增多。在电力系统的构建中,10kV配电网是电力系统中的重要组成部分之一,而10kV配电工程的电缆则是配电网的重要组成部分,是电能运输的主要途径。10kV配电工程中电缆的性能、质量直接影响着10kV配电网的运行。因此,在进行10kV电缆网材料选择、设计时,要求进行科学、合理的比较、探索。本文就基于KNN的10kV配电电缆绝缘状态评估展开探讨。

  • 标签: 10kV电缆 KNN 状态
  • 简介:Variousindexstructureshaverecentlybeenproposedtofacilitatehigh-dimensionalKNNqueries,amongwhichthetechniquesofapproximatevectorpresentationandone-dimensional(1D)transformationcanbreakthecurseofdimensionality.Basedonthetwotechniquesabove,anovelhigh-dimensionalindexisproposed,calledBit-codeandDistancebasedindex(BD).BDisbasedonaspecialpartitioningstrategywhichisoptimizedforhigh-dimensionaldata.Bythedefinitionsofbitcodeandtransformationfunction,ahigh-dimensionalvectorcanbefirstapproximatelyrepresentedandthentransformedintoa1Dvector,thekeymanagedbyaB+-tree.AnewKNNsearchalgorithmisalsoproposedthatexploitsthebitcodeanddistancetoprunethesearchspacemoreeffectively.ResultsofextensiveexperimentsusingbothsyntheticandrealdatademonstratedthatBDout-performstheexistingindexstructuresforKNNsearchinhigh-dimensionalspaces.

  • 标签: 高维空间 快速KNN搜索 比特码 索引结构
  • 简介:在应用PM2.5、PM10、SO2、Co、NO2和03六种污染物浓度指标预测的基础上,将最高气温、最低气温、天气现象、风向、风力5种气象条件指标增添到空气污染预测输入变量中,采用K最近邻(KNN)和支持向量机(SVM)两种算法建立北京市空气污染等级分类预测模型。论文采用中国环境监测总站公布的北京市2014年1月1日至2016年4月30日的6种污染物浓度指标数据以及北京市气象台公布的北京市2014年1月1日至2016年4月30日的5种气象条件指标数据进行测试实验。结果发现,KNN模型预测的准确度为83.56%,SVM模型预测的准确度为87.32%,SVM模型在空气污染等级分类预测方面比KNN模型的准确度高出3.76%,建议将来在北京市空气污染等级预测中采用SVM模型以期获得较好的预测和空气污染控制效果。

  • 标签: 空气污染等级 分类预测 支持向量机 K-最近邻算法
  • 简介:21世纪是信息时代,信息在社会中的地位越来越重要,已成为社会发展的重要战略资源,信息技术改变着人们的生活和工作方式,与此同时,信息安全也已成为世人关注的社会问题。本文介绍了保证信息安全的一种方法:数据加密标准(即DES),重点阐述单钥密码体制中的分组密码的基本概念、结构和加密算法

  • 标签: DES 密钥 明文 密文
  • 简介:摘要:数据结构作为计算机科学的核心,已经成为人们必须掌握的一切信息知识。作为经典的最短路径算法,Dijkstra算法数据结构被在生活中的各方面都有所体现。本文从数据结构和最短路径算法的定义入手,介绍了Dijkstra算法算法优缺点和算法实例,最后阐述了最短路径算法在现实生活中的作用,说明该算法的重要意义。

  • 标签: 最短路径 Dijkstra算法 应用
  • 简介:花丛中有13只蝴蝶,飞走了8只,还剩几只?小明说:"这道题应该用减法计算,算式是13-8。我把8分解成3和5,先算13-3=10(只),再算10-5=5(只)。所

  • 标签: 蝴蝶 算式 算法 分解 减法 计算
  • 简介:摘要:课标要求针对简单问题,尝试设计求解算法,并通过程序进行验证。本课中的例题,两个思考都是先用递归的方法找到算法,在现成的程序中进行修改。本文以解密汉诺塔实践, 探究了本课中最后一个拓展练习。

  • 标签: 递归算法 通式 拓展练习
  • 简介:本文主要介绍SFL算法的流程图和算法,并总结出SFL算法的易于理解、参数较少、收敛速度较快、寻优能力强、易于实现等优点。

  • 标签: SFL 算法 参数 优点