学科分类
/ 25
500 个结果
  • 简介:摘要本文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进k-prototypes算法,使该算法满足不同要求的混合属性数据,最后通过C#语言,在ArcEngine2010版本上实现。

  • 标签: K-prototypes算法 混合属性 类型数据 相异度系数 加权属性
  • 简介:

  • 标签:
  • 简介:摘要:“拍照赚钱”是互联网下的一种自助式服务模式,这种基于移动互联网的自助式劳务众包平台,为企业提供了各种商业检查和信息搜集,相比传统的市场调查方式能大大节约成本,并有效地保证了调查数据真实性,缩短了调查周期,于是APP任务定价的合理性变的很重要,定价与任务不合理的完成任务就少或信息不准确,影响市场调查结果。本文通过对项目任务定价规律的研究,利用Matlab绘制了任务经纬度坐标与定价数据三维拟合图并对城市内会员分布进行聚类分析,得到任务定价规律。

  • 标签: 聚类算法 任务定价
  • 简介:摘要:为了克服Chameleon算法无法有效的处理混合属性数据的缺点,本文提出一种改进的Chameleon算法。该算法首先采用一种新的两阶段整合算法,适用于处理大规模数据集;其次对聚类分析中计算相似性的欧式距离进行拓广,使新算法能够处理混合属性数据。通过实例验证该算法可以很好的解决含有混合属性的大规模数据集问题。

  • 标签: Chameleon 大规模数据集 混合属性数据
  • 简介:摘要:随着我国基础建设的持续推进,隧道工程的重心逐渐由建设转为运维,客观且高效地诊断衬砌健康状态是隧道安全运维的关键。本研究提出了一种基于算法的隧道衬砌健康诊断方法。首先以固定长度的衬砌为单位,通过裂缝的最大宽度、总长度构建病害空间样本;利用K-means++实现样本的客观与分级;通过偏最小二乘法量化样本的相对欧氏距离,提出了客观的隧道风险指标TRI。结果表明该方法能有效诊断隧道运营状态,有助于隧道健康的智能分析和客观诊断,对既有隧道的安全维护具有重要的参考价值。

  • 标签: 隧道衬砌健康评估 K-means++ 聚类 病害诊断
  • 简介:摘要准确把握区域耕地数量、质量现状以及未来变化,对实现耕地保护由数量平衡与管理向数量-质量综合平衡与管理具有重要意义。本文通过对2013年海伦市各乡镇关于耕地质量的数据进行研究,分析海伦市各乡镇耕地质量的差异性。

  • 标签: 耕地质量 聚类分析 分等定级
  • 简介:摘要:山体地质灾害如滑坡、泥石流、坍塌等是影响附近道路、人民安全的潜在隐患。国土资源局等相关部门承担地质灾害预防和治理的责任的重要机构,如何针对该地区地质灾害突发的特点,快速根据事先制定的应急措施高效、准确地进行监测勘察,是需要解决的重要问题。公路滑坡灾情评估的方法有实地调研考察法、地理信息系统技术(GIS)等。本文在定性与定量基础之上,结合灰色理论和信息熵对不同情况下公路滑坡灾情系统进行研究与开发,多方位、多角度、不同层次地探讨公路滑坡灾情评估的综合分析方法,旨在建立公路滑坡灾情分析与评估的不确定性系统理论、方法,为实现人类对公路滑坡灾情的有效支援和管理提供科学的策略与方法。

  • 标签: 灰色聚类 公路滑坡 评估方法
  • 简介:

  • 标签:
  • 简介:   摘要:针对传统的相似度计量方法根据用户评分信息矩阵来计算物品或者用户相似度,需要考虑所有用户反馈的历史信息,提出一种改进的协同过滤推荐算法。首先,将所有物品度的平均值作为一个阈值,选出高密度阈值物品。其次,使用可变网格的方法将有共同兴趣是用户为同一。最后,在内用推荐算法对用户进行物品推荐。实验结果表明新算法在一定程度上提高了推荐系统的推荐精度和质量。

  • 标签: 可变网格 协同过滤 推荐算法 相似性度量
  • 简介:摘要:针对目前市场上已有的桌面文件整理软件不够智能化,不能根据文件文本信息进行分类的问题,根据文件的标题和文本内容,开发出了一款基于凝聚层次和词袋模型 分类的智能化桌面文件整理软件。算法适用于用户使用初期零散文件较多的情况,将散乱的桌面文件自动划分为不同的类别,并整理成对应的文件夹;分类算法适用于用户后期零散文件继续增加的情况,将各文件匹配到对应文件夹。实验结果表明,在短文本,且样本数量较少的情况下,上述算法能很好地对桌面文件进行类别的划分和分类的准确率分别达到了90%和86.77%。该软件能很好地解决桌面文件整理问题。

  • 标签: 桌面文件整理文本信息凝聚层次聚类词袋模型
  • 简介:摘要文章针对遥感图像的模糊算法进行了研究。数字图像分类技术是数字图像处理技术中非常重要的一个内容。遥感图像固有的模糊性,对于遥感数字图像来说,尤其是中、低分辨率遥感图像,由于混合像元的影响使得分类结果并不是最优的,也就是说,传统的分类方法往往不能取得理想的分类效果。而应用软分类算法原理,采用模糊方法进行遥感图像的非监督分类是解决这种分类模糊性的主要方法之一。文章研究模糊中的模糊C均值算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。此算法与人工判读分类相比,提高遥感图像非监督分类的速度和效率,节省了人力和物力。

  • 标签: 遥感图像分类 模糊聚类 模糊C-均值算法
  • 简介:摘 要:针对战场环境数据量大、数据种类多的特点本文提出了基于VSM和AMMK-means的信息推荐方法,为不同席位提供主动服务,增强指挥员的战场感知能力。本文首先使用VSM来表示战场信息的文本特征,然后采用AMMK-means算法对战场信息进行分类,构建用席位兴趣模型,最后计算席位兴趣模型和候选信息之间的相似度并向席位推荐其感兴趣的战场信息。

  • 标签: 个性化推荐 信息特征向量 态势推荐 文本聚类
  • 简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数据流的异常检测问题,该文将流数据算法与电力大数据相结合,针对现有流数据算法不易存储全部数据、断电数据易丢失等问题,以及流数据算法对于离线阶段算法实时应答的要求,从数据的完整性、安全性以及流数据算法的低时间复杂度的角度出发,对 CluStream 流数据算法进行改进,提出流式 K-means 算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段算法进行优化,使用最佳距离法确定初始中心,减少迭代次数;最后,使用所提出的流式 K-means 算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。

  • 标签: 电力大数据 流数据聚类 流式 K-means聚类 用户用电异常
  • 简介:摘要 大数据时代下推文的推荐模型能够快速有效的筛选出适合于不同用户的数据信息。类比电商平台常用的推荐系统与搜索引擎使用的页面推荐算法,量化文字信息使得将数据带入推荐系统成为可能,构建推文之间的拓扑关系图建立推文-推文、用户-用户之间的关系群,进而使用模糊-协同过滤算法提供基于推文或基于用户的推文推荐算法。

  • 标签: 层次分析法 PageRank 模糊聚类 协同过滤推荐
  • 简介:摘要:地市供电公司通过归类分析进而准确、快速、有效地发掘用户侧需求响应潜力是缓解高峰时期供电压力和保障电网安全运行的重要举措。用电负荷在电力需求侧响应中具有重要作用,可以帮助实现电力系统的优化调度、提高能源利用效率和促进电力市场的健康发展。本文结合面向电力需求侧响应的用电负荷策略进行研究,以供参考。

  • 标签: 面向电力需求 侧响应 用电负荷聚类 策略
  • 简介:摘要聚合物驱油已成为大庆油田稳产、持续发展的重要技术,针对二油层上返注的特点,本文通过探索优质高效的聚合物注入管理方法,使地面工程更好地满足地质开发的需要。

  • 标签: 二类油层 优质高效 聚合物 注入 管理
  • 简介:摘要近年来,基于灰色法的绿色建筑设计方案评价问题得到了业内的广泛关注,研究其相关课题有着重要意义。本文首先介绍了设计方案主要要求,分析了绿色建筑设计的重要性。在探讨绿色建筑设计原则的基础上,结合相关实践经验,分别从多个角度与方面就基于灰色法的绿色建筑设计方案评价体系的建立问题展开了研究,阐述了个人对此的几点看法与认识。

  • 标签: 灰色聚类法 绿色建筑 设计方案 评价
  • 简介:摘要:当前全世界都对环境的关注度越来越高,绿色发展已经成为所提倡的生产生活方式,提高能源的利用效率,减少能源消耗,已经成为可持续发展的必由之路。调查显示建筑业能耗在全社会能耗的占比高达30%,常用的建筑建材的能耗达到13.6亿吨。为了适应当前绿色发展和低能耗建筑的要求,装配式的建筑由于自身具有节能、环保、绿色施工等特征,广泛受到欢迎,同时也契合了当前我国建筑行业所倡导的“四节一环保”理念。为了更好的在建筑施工行业推行绿色施工,国内外的现在学者对于建筑绿色施工评价进行了深入的研究。

  • 标签: 建筑绿色施工评价 灰色聚类 装配式建筑