面向云计算的多核处理器存储和网络子系统优化设计

(整期优先)网络出版时间:2019-11-26
/ 2

面向云计算的多核处理器存储和网络子系统优化设计

乔林

(国网辽宁省电力有限公司信息通信分公司)

摘要:本文在云计算背景之下,针对多核处理器储存以及网络子系统存在的问题进行了探讨,研究了优化设计方面的关键策略,认为为了提高多核处理器存储以及网络子系统的运行性能,需要关注系统互连与数据通路、IDMA设计与系统并行、以及网络系统方面的优化设计工作,以提高系统运行效率与水平。

关键词:云计算;多核处理器;网络子系统;设计

在当前网络计算机研究领域当中,有关云计算课题的研究一直都是各方关注的重点。当前的云计算基数具有访问量高、并行高、以及虚拟化的特点,能够依赖于云计算数据中心,面向用户提供访问功能。但在支持用户对云计算数据中心进行访问时,必须在数据中心终端上安装虚拟机系统,会导致多核处理器的运行性能与效率受到不良影响。如何解决这一问题,已成为云计算以及云计算数据中心发展中最为重要的问题之一。本文即探讨面向云计算的多核储存器储存以及网络子系统优化措施,以达到提高多核处理器运行性能的目的。

1系统互连与数据通路

本研究中以God-son3多核处理器架构为基础,探讨云计算技术影响下多核处理器存储方面的优化设计策略。对应的多核处理器基本结构如下图所示(见图1)。

图1多核处理器基本结构示意图

结合图1,在整个多核处理器当中,四个同构的改进GS4646处理器在DMA的支持下完成与一级8*8交叉开关的连接,而二级cache内存至核内存储空间、cache内存至本地存储空间的数据传输则在DMA的支持下实现。同时DMA还负责支持原处理器与片上网络的直接相连。一级交叉开关下属cache具有四写四读功能,在cache协议共享条件下以并行的方式形成二级cache,大小为4.0MB。其中独立cache块均为四路组相连结构。

相较于传统方案,在本研究中处理器内部对2*千兆以太网卡进行集成处理,并实现与多核处理器内部一级交叉开关的连接。通过这种方式,能够有效避免桥片在存储中出现的延迟问题,同时减少减少网络数据途径I/O控制器过程当中出现的之后。并且,在多核处理器一级交叉开关内可以增加对DCA相关功能的支持,网卡内所设置的DMA引擎能够使网络数据被直接传输至二级cache当中,从而使终端对网络数据的访问更加的及时与高效。

在此基础之上,多核处理器内部还集成了256位寄存器(共配置128个),用于多核处理器的内部存储空间。在寄存器的配置条件下,还实现了浮点运算部件的向量扩展(扩展至256位),通过此种方式明显提高了处理器核的计算能力。同时引入IDMA设计,对原有访问存储模型进行改性,使向量部件数据传输中的有效带宽得以明显提高。

2IDMA设计与系统并行

为了使多核处理器在运行过程当中的数据传输更加突出高带宽以及高效率方面的特点,需要工作人员在优化设计的过程当中引入处理器内部的IDMA专用引擎,其主要功能实现支持缓存访问的不同物理地址间对数据进行拷贝,同时实现核内存储空间至核外存储空间的批量数据传输。由于传统的DMA部件在虚拟化方面存在一定局限,因而在优化设计的过程当中需要重点关注如何提供虚拟化的支持。具体优化设计策略为:

首先,需要进行支持动态配置的多通道优化设计:在多核处理器内,每一独立的IDMA控制器均有与之对应的写入通道(1条)以及读取通道(3条),相应通道的配置寄存器相互独立,可根据任务需求对任意大小的数据流进行传输,不同传输任务之间的切换可通过IDMA控制器的方式实现。这种设计方案下最大的优势是能够对各个数据流所对应的工作现场加以保存,数据流以并发方式传输,不存在额外的硬件开销。因此,IDMA控制器在虚拟机调度等需要对程序进行频繁切换的环境当中仍然能够保持高水平的工作性能与效率。

其次,需要进行可控的细粒度并行设计:传统意义上多核处理器内所设置的DMA控制器数据传输任务具有典型的原子性特点,开始工作后无法停止,且相对于外部而言,内部数据传输状态是完全公开与透明的,这一特点导致系统异常处理以及虚拟化操作存在局限。在优化设计过程当中,为了解决该问题,可以在IDMA控制器内增设具有可配置特点的标记信号,将其作为与处理器实现交互的接口。处理器能够对标记信号进行查询,进而了解对应通道的传输状态以及传输进度,同时也通过支持配置的方式,实现对各条通道的启动/暂停操作。在优化设计过程当中,相应标记信号为1则意味着处理器能够对该数据进行使用,否则则由IDMA进行使用。在不断改变标记信号位状态的过程当中,实现细粒度数据的并行传输与计算。在此过程当中,优化设计的具体方案如下图所示(见图2)。

图2可控细力度并行设计方案示意图

3网络系统优化设计

在网络系统优化设计方面,最关键性的问题是降低I/O总线传输过程当中网络数据的延迟问题。针对该问题,可以采用经过改进的DCA也就是直接缓存访问技术。该技术的基本原理是将I/O总线传输数据直接转入缓存模块当中,降低中央处理器数据访问延迟。但研究表明简单的DCA会在系统负载压力较大的情况下产生大量缓存缺失,同时传统多核处理器结构缺陷降低了DCA的效果。导致以上问题的原因为,第一,网卡DCA时,短时间内大量的I/O数据被连续存入高速缓存会导致原有高速缓存中的数据被彻底换出,在系统高负载的情况下这会极大降低原有程序性能;第二,由于DCA的数据仍要通过I/O总线传输至高速缓存中,这将不可避免地花费上千时钟周期来完成I/O控制器上的信号转换,因此DCA的效果被显著降低。针对以上问题,在优化设计过程中可采取的具体措施是:将I/O总线上的网卡下移动,至靠近处理器核的一级交叉开关上,同时引入高级功能cache锁,对一系列时间开销大的代码与数据(包括网卡DMA描述符、中断处理函数等在内)进行快速访问,使被锁住的数据储存在高速缓存模块内,对于解决因网络处理程序时间局限而导致的性能缺陷问题有重要价值。

4结束语

通过本文以上分析可以明确的是:在对云计算数据中心进行优化完善的过程当中,多核处理器数据传输方面的性能、I/O运行性能、以及网络性能会在不同程度上对云计算数据中心的整体效率产生影响。从这一角度入手,在本文以上分析中着眼于对系统互连结构的调整,利用IDMA技术来解决不同存储空间在数据传输效率方面的问题,使DCA得到了优化,并在cache锁技术的辅助下实现了对整个网络子系统运行性能的优化。上述各项操作的实施使得云计算数据中心的整体性能得到了改善,在云计算数据中心的建设中有非常确切的应用价值。

参考文献:

[1]周宏伟,邓让钰,李永进等.多核处理器验证中存储数据错误快速定位机制[J].国防科技大学学报,2012,34(6):1-6.

[2]邓让钰,陈海燕,窦强等.一种异构多核处理器的并行流存储结构[J].电子学报,2009,37(2):312-317.