机 器 学 习 理 论 研 究

(整期优先)网络出版时间:2020-11-16
/ 2

 机 器 学 习 理 论 研 究

赵天宇

61632部队 北京市 10010

摘 要:机器学习是人工智能的一个分支,是现代计算机技术研究一个重点也是热点问题。机器学习就是计算机模仿人类获取知识的模式,通过建立相应的模型,对外界输入通过记忆、归纳、推理等等方式,获得有效的信息和经验总结,进而不断的自我完善,提高系统的功能。文章梳理了机器学习的发展历程,并对机器学习进行了分类,阐述了三种机器学习的经典算法,并在文章最后对机器学习的未来发展进行了展望。

关键词:机器学习;算法;神经网络





0 引言

机器学习是人工智能的一个分支,是现代计算机技术研究一个重点也是热点问题。顾名思义,机器学习就是计算机模仿人类获取知识的模式,通过建立相应的模型,对外界输入通过记忆、归纳、推理等等方式,获得有效的信息和经验总结,进而不断的自我完善,提高系统的功能。目前,一般公认H.Simon对于机器学习的定义,即“如果一个系统能够通过执行某个过程改进它的性能,这就是学习。”当然这是一个比较泛化的概念,系统一词,涉及了计算系统、控制系统、神经系统、函数模型系统、人的系统等等多个范畴,不同的系统又属于不同的领域。即使是同一个系统,也因为目标不同,学习的方法和途径,数据分析的策略也都有所不同。但是无论是哪种系统的哪类知识的学习,其目标归根结底都是从大量无序的信息中获得有序的可以被有效利用的知识。

1 机器学习的发展历程

机器学习的发展大致可以分为四个阶段。

第一阶段:20世纪50年代中叶至60年代中叶,这个时期研究对象是没有知识的学习,目标是各自组织和适应系统。此阶段有两个代表,一是1957年Rosenblatt提出了感知机算法,这是第一个具有重要学术意义的机器学习的算法。二是50年代末,Samuel编写了跳棋程序,利用启发式搜索技术,可以从经验和棋谱中进行学习,不断调整棋盘评价函数,提高棋艺。

第二阶段:20世纪60年代中叶至70年代中叶,本阶段是模拟人类的学习过程,采用逻辑结构或图结构作为内部描述。代表有:1969年Minsky与Papert出版的对机器学习研究有深远影响的著作《感知机》一书。

第三阶段:20世纪70年代中叶至80年代中叶,在这个时期,人们从学习单一概念延伸至学习的多个概念,探索不同的学习策略和各种学习方法。在此阶段中,已经将机器学习系统与现实应用相结合,完成相应的学习过程,取得了很大的成功。1980年,在美国召开的第一届机器学习国际研讨会,标志着机器学习在全世界范围内的全面兴起。

第四阶段:1986年至今。由于作为机器学习科学基础之一的神经科学研究的重新兴起,机器学习也进一步受到了人们的重视。另一方面,对实验研究和应用研究得到前所未有的重视。

2 机器学习分类

机器学习,一般根据处理的数据是否存在人为标注主要分为监督学习和无监督学习。
监督学习的数据集包括初始训练数据和人为标注目标,希望根据标注特征从训练集数据中学习到对象划分的规则,并应用此规则在测试集数据中预测结果,输出有标记的学习方式。
无监督学习,用于处理未被分类标记的样本集数据并且事先不需要进行训练,希望通过学习寻求数据间的内在模式和统计规律,从而获得样本数据的结构特征,因此,无监督学习的根本目标是在学习过程中根据相似性原理进行区分。

总之,机器学习就是计算机在算法的指导下,能够自动学习大量输入数据样本的数据结构和内在规律,给机器赋予一定的智慧,从而对新样本进行智能识别,甚至实现对未来的预测。

3 机器学习经典算法

一般机器学习的目标就是在一定的网络结构基础上,构建数学模型,选择相应的学习方式和训练方法,学习输入数据的数据结构和内在模式,不断调整网络参数,通过数学工具求解模型最优化的预测反馈,提高泛化能力、防止过拟合。机器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程。

3.1决策树算法

决策树算法整体形状为树状结构的预测模型,将实际中的例子以根节点开始,排列到叶节点,将实际例子进行科学分类,对应节点是实例的分类。决策树算法是将以分裂和剪枝方式,采用 ID3、C4.5、CART 等算法,开展决策树型学习。该算法是自上而下的算法,每节点分类效果选择最优属性,将节点下分 2 个以上节点,重复该过程,确保其决策树能够准确开展分类训练集,相应属性被自身使用过。在实际分类学习中,叶节点对应一个类,归叶节点所属,节点汇总有多类样本,可针对叶节点中的样本数量,找到样本数量最多类别。要解决回归类屋内,可以对数量值取平均数支持工作。

3.2人工神经网络算法

人工神经网络受生物学启发,以神经元理论为支持组成复杂网络。人工神经网络与其具有相似性,也是由简单的单元密切连接组成,每一单元具有一定实值输入,产生单一实数值输出。在人工神经网络中,模型具有多样化特点,不同模型之间的差异表现在途径、结构、运行方式、算法及应用等方面。常见模型为多层前向神经网络 MLFN、自组织神经网络、SOM 及 ART 等。

3.3深度学习算法

深度学习是机器学习领域的一个最新发展。目前深度学习网络模型种类很多,根据层次结构,可分为基本模型和整体模型;根据数学特性分类,可分为确定性模型和概率型模型;根据网络连接方式,可分为邻层连接、跨层连接、环状连接深度模型等等。

通过深度学习的研究与应用,机器学习已经展示出强大的自我学习能力,实现全局特征和分布式特征的提取,从而推进人工智能里程碑式发展。

4 机器学习运用前景与挑战

随着机器学习的深入研究与应用,新的网络结构和学习算法不断涌现,进一步推进了机器学习的发展。机器学习理论研究将会成为一个新的热点,在认知计算、类脑计算的支撑下将促进机器学习向更高阶段发展,在此基础上将会出现性能更好、结构优化、学习高效、功能强大的机器模型,非监督机器学习将会取得实质性的进展。机器学习的自主学习能力将进一步提高,逐渐跨越弱人工智能阶段,不断提高智能性。机器学习将向人类的学习、认知、理解、思考、推理和预测能力迈进,必将推动人工智能及整个科学技术的迈向更高台阶。

随着机器学习与大数据、云计算、物联网的深度融合,将会掀起一场新的数字化技术革命,借助自然语言理解、情感及行为理解将会开启更加友好的人机交互新界面、自动驾驶汽车将成为现实,我们的工作、生活中将出现更多的智能机器人,在医疗、金融、教育等行业将能够给我们提供更多智能化、个性化服务。


参 考 文 献

[1]张浩,吴秀娟.深度学习的内涵及认知理论基础探析[J].中国电化教育,2012,10:7-11.

[2]余凯,贾磊等. 深度学习的昨天、今天和明天[J]. 计算机研究与发展, 2013,50(9):1799-1804.

[3]YANN L C.BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521(7553):436-444.

[4]文馗.基于深度学习的图像识别方法研究与应用[D].华中师范大学,2017.

[5]刘杨,深度学习在手绘草图识别中的应用研究[D].安徽大学.

[6]张润,王永滨.机器学习及其算法和发展研究[J].中国传媒大学学报(自然科学版),2016,23(2):10-18.



作者简介:赵天宇(1990-),男,江苏盐城,硕士研究生,研究方向为军事运筹学。