学科分类
/ 2
28 个结果
  • 简介:将Lasso算法和logistic回归模型相结合并且引入P2P个人网络信贷评估体系,通过模拟实验的结果发现,在全变量logistic模型、Lasso-logistic模型、Ridge-logistic模型中,Lasso-logistic模型对于变量的压缩效果要更好,有助于简化模型;虽然三个模型在进行预测的结果上并没有显著的差异,但是Lasso-logistic模型在计算效率上更胜一筹,在处理大量数据的情况下更有效率。

  • 标签: 个人网络信贷评估 Lasso-logistic模型 变量选择
  • 简介:<正>八届人大四次会议新近通过并正式公布的《中华人民共和国个人所得税法》将工资、薪金所得部分与个体工商户的生产、经营所得和对企事业单位承包经营、承租经营的所得部分分别采行不同的超额累进税率和税级来进行计算。可推导出全套简

  • 标签: 简便计算法 个人所得税法 应纳税所得额 薪金所得 税级 税率表
  • 简介:基于数据分布密度划分的聚类算法是数据挖掘聚类算法中的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计出高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区产生数据集的子簇空间,并进行子簇合并形成了理想的聚类结果;依据算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。

  • 标签: 聚类算法 密度分布 分步投影 多重分区
  • 简介:针对EM算法在估计混合正态分布参数时使用不完全信息的总样本所得到的参数估计误差较大的问题,提出一种新的估计方法——TU截断改进算法。该算法根据正态分布的特点,运用部分拥有完全信息的样本将混合正态分布中的分布参数逐一估计出来。这一算法一方面克服了EM算法运用于混合分布的缺陷,另一方面改进了使用截尾数据的参数估计。仿真结果表明,TU算法比EM算法估计更精确。

  • 标签: 混合正态分布 EM算法 TU算法
  • 简介:获得回答完整的问答是每个调研者所期望的结果,但实际上由于各种原因,总有部分问卷为空白或回答的不完全,这就产生了无回答情况。一般的无回答情况分为两种:一种是单位无回答,另一种是项目无回答。单位无回答是指被调查单位没有接受调查,而项目无回答是指被调

  • 标签: EM算法 个迭代算法 统计调查 无回答问题 似然函数 不完全数据
  • 简介:国家统计居11日公布数据显示,3月份,全国居民消费价格指数(CPI)同比上涨2.3%,与上月持平,达到近20个月以来的高点。物价涨幅“摸高”、经济面临下行压力,面对这样的情况,一些人开始担忧中国经济将面临滞胀。

  • 标签: CPI 居民消费价格指数 中国经济 数据显示 国家统计 物价涨幅
  • 简介:数据挖掘技术及决策树简介数据挖掘就是从大量的不完全的有噪声的模糊的随机的实际应用数据中,抽取隐含在其中的、事先并不知道的、但又是潜在有用的信息和知识的过程。决策树算法作为常用的数据挖掘技术之一,其基本思想是将实例库中记录的大量有限的具体事实数据进行归纳和分类并建立树型结构,以发现并形成隐含在大量实例中的若干形式化的分类判别规则,典型的决策树算法方法有ID3方法和IBLE(Information—basedLearningfromExample)方法。

  • 标签: 决策树算法 教育统计学 应用 数据挖掘技术 树型结构 ID3
  • 简介:在AI领域中,备受关注的一个问题是如何获得更好的分类,尤其是对于多分类的情形。目前,针对多分类算法已取得了大量的研究成果,很多较为高效的多分类算法也已应用到实践中,而对于多分类算法的研究仍然备受关注。以BT-SVM为基分类器,提出一种带阈值的新型动态加权多分类器集成的方法,并通过模拟和实证分析验证该算法的有效性,研究表明该算法对于平衡和非平衡数据的分类效果表现得都比较优良。

  • 标签: BT-SVM 带阈值的动态加权 多分类器集成
  • 简介:平均单一依赖估计算法(averagedone-dependenceestimators,AODE)是通过放松朴素贝叶斯算法的假设条件得到的一种更加高效的分类算法,但AODE算法将所有父属性对分类的贡献程度看成是一样的,这使得AODE算法的分类效果受到限制。针对这个问题,利用相关系数Tau-y和Lambda-y分别计算各个特征属性对分类的贡献程度,并用计算结果对父属性加权,得到了两个改进的AODE算法:T-AODE和L-AODE算法。然后,利用加利福尼亚大学的埃文斯(UniversityofCaliforniaIrvine,UCI)标准数据集在Eclipse上对这两个算法进行分类实验,结果显示两个改进的AODE算法的精确度要优于原始AODE算法

  • 标签: 分类 平均单一依赖估计 相关系数 属性加权
  • 简介:本文通过对鸢尾花数据的研究,提出了一种基于分类器的分类效果差异而进行快速选择的一种改进的BaggingTrees集成算法。并通过同其他统计机器学习方法,如:CART、BaggingTrees、RandomForest以及目前流行的基于遗传算法的选择性集成算法GASEN等比较得出,该算法对于分类问题而言,具有较高的准确率,而且与GASEN算法相比,运行的效率也得到了较大的提高。

  • 标签: 决策树 自助法 选择性集成
  • 简介:选择性集成算法是目前机器学习关注的热点之一。在对一海藻繁殖案例研究的基础上,提出了一种基于k—nleanS聚类技术的快速选择性BaggingTre咚集成算法;同时与传统统计方法和一些常用的机器学习方法相比较,发现该算法具有较小的模型推广误差和更高的预测精度的优点,而且其运行的效率也得到了较大的提高。

  • 标签: 决策树 自助法 选择性集成
  • 简介:以沿海11省市的风暴潮灾害风险为研究对象,采用遗传与粒子群混合算法对投影寻踪动态聚类(PPDC)模型进行优化,将粗糙集理论(RST)与修正的PPDC模型组合运用,对中国沿海地区风暴潮灾害的风险进行综合评估与区域等级划分。实证结果表明:广东和福建两省是中国风暴潮灾害的高风险区,风险评估值超过2.5,山东、浙江、海南和广西属于风暴潮灾害的中风险区,风险评估值处于[1.8,2.2]之间,江苏、天津、辽宁、河北和上海属于风暴潮灾害的低风险区,风险评估值低于1.5。研究结论为国家实施差异化的灾害风险管理战略提供了思路与参考。

  • 标签: 风暴潮灾害 风险评估与区划 投影寻踪动态聚类
  • 简介:★黄果树大瀑布黄果树国家重点风景名胜区位于贵州省西南,距省会贵阳市128公里,距旅游中心安顺市45公里,有贵黄高等级公路直达景区。以黄果树大瀑布为中心,周围雄、奇、险、秀,风格各异的瀑布一个接着一个,形成一个大的瀑布“家族”,被世界吉尼斯总部评为世界上最大的瀑布群,列入世界吉尼斯纪录。

  • 标签: 旅游景区 贵州省 吉尼斯纪录 高等级公路 风景名胜 旅游中心
  • 简介:X^2检验在参数检验和非参数检验有着广泛的应用,但在教学和科研中,我们发现X^2检验应用功能被扩大化了,教学和科研人员往往忽略了使用X^2检验的前提条件和应用的局限性。本文着重讨论X^2检验在非参数检验中的两个比较严重的局限性问题,并提出了相应的解决方法.以期提高统计方法应用的准确性.

  • 标签: X^2检验 Pearson列联系数 问题探讨 局限性
  • 简介:X^2拟合优率检验主要用于检验某种理论分布与其实际分布间的吻合程度,由于该种检验产其它同类检验(对数似然比检验,Kalmogorov检验等)更为简捷方便,因而受到普遍的推荐,在社会科学,教育测量学及生物医学等众多领域得到了广泛的应用。

  • 标签: 统计学 小样本资料 X^2拟合优度检验 概率计算 血型调查
  • 简介:第一条为保障国家统计调查工作顺利进行,规范《国家统计调查证》的发放和管理工作,根据《中华人民共和国统计法》第二十三条的规定,制定本办法。第一条《国家统计调查证》是全国统计系统的调查人员在执行国家统计调查任务时证明其身份的专用证件。调查人员在进行调查活动时.应当主动向有关统计调查对象出示《国家统计调查证》。县级以上各级人民政府统计机构的工作人员,可持工作证依法执行统计调查任务。第2条《国家统计调查证》由国家统计局统一印制,分级核发和管理。第四条下列调查人员,发给《国家统计调查证》:(一)纳入国家编制管理的农村社会经济调查队、城市社会经济调查队、企业调查队的调查人员及其聘用期在一年以上的调查人员;

  • 标签: 统计调查 调查人员 国家统计局 企业调查队 政府统计机构 有效期限