轻量化人工智能方法研究

(整期优先)网络出版时间:2023-12-01
/ 2

轻量化人工智能方法研究

牛志嘉

140525198803103110

摘要:人工智能在很多领域都有广泛的应用,一般都需要大型的服务器和大量的训练数据,随着新时代的发展,轻量化、前端化的人工智能将会越来越多地出现在人们的面前。本文首先对轻量化人工智能进行了分析,然后对其进行了简单的介绍,以期对有关人员有所帮助。

关键词:轻量化;人工智能;图像预处理

引言

在嵌入端对图像进行预处理,再将相关的处理信息传送到对应的解析模型中,进行系统的推理,最后得到识别结果。已有的研究表明,在嵌入端上执行识别任务可以有效降低计算时间,而在嵌入端上使用人工智能可以有效地提升合成的计算速度。

一、轻量化人工智能分析

轻量化人工智能能够让目前的一些服务,例如手机拍照、语音助手等,更加高效、快速,而不需要为了让深度学习模型运行而需要与云进行连接。另外,轻型人工智能还能拓展出更多的应用,比如基于手机的监控分析、无人驾驶等等。轻量化人工智能能够推动人工智能向主流化方向发展,有效地降低其使用成本与部署难度,推动人工智能由原本的高科技竞争向普惠的智能生态转变,使轻量化人工智能逐步成为人工智能研究的主流。从外部来看,轻量化人工智能就是一种减法,它可以减少能量消耗,从而减少对交通通信和硬件平台性能的需求。但归根结底,重量是一种叠加。随着行业的发展,人工智能的工作变得更加复杂,因此,轻量化人工智能必须将注意力集中在更高的计算密度上,才能发挥出最大的作用。在近似无损伤的情况下,推动计算载体与智能模型的小型化,是一项极具挑战的重大课题,亟需对神经网络进行轻量化设计、创新计算体系结构、提高计算速度、实现模型的硬体化。

二、轻量化人工智能方法

(一)卷积神经网络

卷积神经网络是一种能模仿生物视皮层、对边界非常敏感、具有权重分配、局部连通等特点的神经网络,通过局部连接(即卷积层点与前端点相互连通),实现了对图像的局部连接(即局部连通)。权值共享是指一群链接可以共用同样的权值。这种特性使得卷积神经网络与全连接神经网络相比,整体参数总量大幅减少,模型复杂度降低,在语音识别和图像处理方面具有更高的性能。卷积神经网络可以实现多维参数的同步,包括输入、输出和隐含层。其中,传送层的功能包括:从网络中接收有关的数据,并对接收到的信息进行标准化处理,这样就可以加快模型的收敛速度,并将图像数据直接输入到该系统中,包括了RGB三通道和两位像素,一般情况下,还可以支持对传输数据格式的合理调整。其中,隐含层包括了BN层、完全连接层、池化和卷积层等多种结构,是神经网络的核心。在实际应用中,为了获得最后的结果,往往还需要添加一个回归层来实现对各种类型的概率的输出。

几种不用类型的经典模型具有以下特点:第一是VGG模型,利用较小的卷积核不断叠加来代表大的卷积核,从而保证在同等感知条件下,可以进一步加深网络深度,促进模型学习更多东西,降低参数总量,从某种程度上可以优化神经网络效果。在卷积结构中,将1×1卷积核与 VGG模型相结合,能够在保证正常传输的前提下,对非线性变化进行融合,从而提高网络的整体表达性能,降低计算总量。第二种是 RESNET,基本思想是将残差单元的概念引入到 RESNET中,在传统的神经网络中,神经网络的模型一般都是线性顺序,就像是一层又一层,没有任何的分枝,随着深度学习的发展,神经网络的整体模型越来越复杂,顺序模型已经跟不上新的发展,因此,一些研究者提出了一个残值网络,它可以将这一层的输出作为下一层的输入,从而形成一个残值网络的基础。第三类是 MOBILENET,针对的是移动端和嵌入式端的轻量级CNN模型,它的特点是采用了深可分卷积的思想,可以减少模型的参数,同时又不会对模型的精度造成太大的影响,适合于嵌入端。用两个步骤的卷积法代替了池化层。

(二)PC端训练模型

建立神经网络模型,对其进行综合性能分析,筛选出性能最优的算法,并在此基础上对算法进行训练,筛选出运行性能较好的算法,确保算法的收敛性。一般来说,随着学习率的提高,它的收敛速度会加快。如果学习率降低,很容易造成整个网络出现局部最优现象。如果学习率过高,就会使特定位置的模型出现反复震动的问题,从而没有能够达到最小值。在这一点上,LOSS函数可以选择交叉熵损失函数,并对编码 LOSS展开计算。最后,用模型精度来进行评价,在嵌入端设置一个性能最优的模型。

(三)图像预处理

在嵌入端摄像系统中,可以读取彩色图片,在训练模型中所用的 EMNIST数据集呈现出的是灰度图像格式,因此,需要对相关图片进行处理,将其转化成与数据集相同格式的图片,才能进一步将其传送到模型进行推理。在 OPEN CV的基础上,对图像进行预处理,它可以支持图像的常见处理算法,在当前版本中,还可以增加机器学习算法,辅助深度学习。灰度化是指将彩色影像资料从影像系统中读出后,再将红色、绿色、蓝色等影像形态转化为灰度影像的过程。均值模糊指的是对相关的图像数据进行卷积运算,在这里,卷积被称为模板,是一种固定值,主要作用是让整个图像变得更模糊,增大边缘轮廓和整体范围,还能有助于图像的降噪。二值化是指一张二值图像,对于图像的整体识别与目标的分析有着很大的帮助,通过对图像的处理,可以对图像进行形态学处理,简单来说,就是将超过阈值的图像转换成255,低于阈值的图像转换成0。字符提取分割,以字符串为对象,对其进行分割提取,能够将其进一步划分为组成和切割字符,将其调整成正方形,并对其进行膨胀处理,与此同时,还能对具体尺寸实施合理的调整。在进行了以上的几个环节的处理之后,就可以实现对字符的提取。与此同时,在经过系统的处理之后,将不同的子图转换为统一的尺寸,这样就可以方便地将相关的数据结果传送到模型中,进行推理,最终得到正确的推理结果,并用概率来表达,而这个概率主要是由函数激活后的输出层输出的。

(四)TENGINE嵌入式框架

TENGINE是一款面向嵌入式应用的高性能深度学习推理框架,可为嵌入式应用提供最优的部署体验。它同样是一种模块化、开源框架设计,在计算过程中只依赖 C/C++库,在实际运行中具有高效、轻量、量化训练以及支持异构计算等特点。在对相关图片数据进行处理之后,将其传输至 TENGINE内。在嵌入式端可以对各种字符和数字展开精确的识别,并对各种字符进行精确的预测。摄像头负责采集图片,在嵌入式端内进行推理,通过概率呈现推理结果,可以对具体概率和类型进行准确的预测,并通过摄像头对各帧图片展开实时处理。增加一个嵌入端,有助于提高识别的效率和速度。

结语

综上所述,由于人工智能网络在运算方面会形成庞大的计算资源,因此,人工智能训练主要集中于服务端,在算力不足以及网络条件限制下开展人工智能存在较大的难度。因此,亟需对轻质人工智能的处理方法展开系统性的研究,以进一步提升其在嵌入式终端和存储上的优势,为轻量化人工智能的创新发展提供支撑。

参考文献

[1]李前,蔺琛皓.云边端全场景下深度学习模型对抗攻击和防御[J].计算机研究与发展,2022,59(10):2109-2129.

[2]徐宣哲,宁珂.基于硬件仿真系统的边缘计算人工智能视觉芯片设计验证[J].物联网学报,2022,6(01):20-28.