虚拟机高可用技术研究与应用

/ 2

虚拟机高可用技术研究与应用

胡磊1      孙旭1   卢浩1 

空军预警学院 教研保障中心,武汉 430014

摘  要:业务系统的可用性决定了该系统能否高效稳定地给用户提供服务,为最大化实现业务系统可用性,关键在于了解各种高可用技术能够使用哪些特性,虚拟机高可用技术是一项保护虚拟机可用性的功能。本文简要介绍VMware FT技术的高可用性特性,并在特定场景下结合使用该技术保证业务系统稳定运行。

关键词:虚拟化;Fault Tolerance(FT);高可用

正  文

虚拟机高可用技术简介

虚拟化,是指通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。在一台计算机上同时运行多个逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。

VMware是一个业界顶尖公司,其主要业务是提供虚拟化技术服务。Fault Tolerance(FT)基于ESXi主机平台构建,在不同的主机上运行相同的虚拟机来提供连续可用性。通过创建与受保护虚拟机相同,并且可在发生故障时随时切换,替换受保护虚拟机的辅助虚拟机,来确保受保护虚拟机的连续可用性。受保护的虚拟机称为主虚拟机。而辅助虚拟机,必须在其他主机上创建和运行。辅助虚拟机与主虚拟机的执行方式相同,且可以无中断地接管任何点处的执行,因此可以提供容错保护,保障用户不会遭遇服务中断和数据丢失的情况。典型应用场景有以下三个类:

1)需要始终保持可用的应用程序,尤其是那些具有长时间客户端连接的应用程序,用户希望在硬件故障期间保持这些连接。

2)不能通过任何其他方式实现群集功能的自定义应用程序。

3)可以通过自定义群集解决方案提供高可用性,但这些解决方案太复杂,很难进行配置和维护的情况。

虚拟机高可用应用部署

VMware Fault Tolerance(FT)基于ESXi主机平台构建,目前支持vSphere 6.0以上版本,部署基础条件有三个方面:1)ESXi主机必须使用受支持的CPU,目前市面上主流服务器CPU几乎都支持FT技术,如Intel或者AMD系统CPU;2)ESXi主机网络必须万兆以上,在千兆网络下使用会出现错误提示;3)ESXi群集中应至少有三台主机,虚拟磁盘在2TB以下;且不支持虚拟机快照和迁移,建议删除光驱、USB和声卡驱动,不启用RDM。

配置使用VMware FT有如下五个过程:

1)安装主机ESXi系统,创建vCenter,创建VMware HA集群,添加主机,并检查合规性;

2)为主机配置网络,每台主机建议连接两个不同的网络交换机,需配置两个网卡分别用于FT(容错)日志记录和VMotion,也就是创建FT日志的VMkernel。而其他网卡用于虚拟机和管理网络流量;

3)在VMware HA集群中启用EVC,选择“为Intel主机启用EVC”;同时确认主机连接的2个存储状态是否正常;

4)选择要配置FT技术的虚拟机(业务系统服务器),确认虚拟机处于关机状态,切未使用FT不支持的虚拟机技术;

5)右键选中的虚拟机,选择“打开Fault Tolerance”,按照向导依次选择目标数据存储和目标主机,经过一段时间,会在后台复制一份主虚拟机备份到目标存储上。

配置连接如图一所示:业务系统虚拟机主虚拟机位于主机1,连接数据存储1,配置FT技术后,生成的辅助虚拟机位于主机2,其VMDK文件位于数据存储2。

图一 VMware FT配置连接图

虚拟机高可用容错测试

在为业务系统虚拟机配置VMware Fault Tolerance(FT)技术后,分别打开主虚拟机和辅助虚拟机控制台界面,辅助虚拟机完全为主虚拟机的镜像,且为只读权限,不能进行任何输入,两者画面完全同步。分别从虚拟机镜像验证,关闭主机系统,断开数据存储3个方面对VMware FT技术的高可用进行测试。

1)虚拟机镜像验证

不管是在虚拟机控制台还是在vCenter对虚拟机进行开关机操作,主虚拟机和辅助虚拟机均会同时开关机;在主虚拟机控制台界面运行一个程序,辅助虚拟机同样也会运行改程序,即使此程序导致虚拟机系统蓝屏,辅助虚拟机同样也执行相同指令,导致系统出现蓝屏。通过以上方法测试主虚拟机和辅助虚拟机完全镜像,没有任何区别。

2)关闭主机系统

为模拟主机1出现意外宕机的情况,将主机1的系统关机,此时业务系统虚拟机的主虚拟机因主机关机,主虚拟机关闭,如图二所示。测试过程中业务系统提供Ping和FTP文件传输服务,当主机1关闭时,测试用户仍然能够正常Ping通业务系统虚拟机的IP地址,同时FTP服务正常传输文件也未中断,因此判断辅助虚拟机正在提供业务系统服务,确保系统服务的高可用。

图二 主机1系统故障

3)断开数据存储

为模拟数据存储出现故障或连接中断的情况,将主机1上的数据存储1的卷删除,此时主虚拟机无法找到其VMDK文件,导致虚拟机不能正常运行,如图三所示。同样测试业务系统虚拟机的Ping和FTP服务,测试用户也能正常Ping通业务系统虚拟机的IP地址,同时FTP服务正常传输文件也未中断,因此判断辅助虚拟机接管业务系统服务,确保系统服务的高可用。

图三 数据存储1连接中断

根据步骤2)和步骤3)的测试方法,如果是主机2或数据存储2出现故障的情况,业务系统虚拟机即变为单机运行的方式提供服务。

通过以上3个方面的测试,验证了虚拟机高可用技术能够在一定程度上解决业务系统高可用的问题,帮助系统管理员解决信息服务的连续性和可用性。本文仅从虚拟机高可用技术简介、配置和容错测试进行浅显的概述,关于提升业务系统的高可用性的技术,假如业务系统本身出现的病毒攻击或其他故障问题;以及虚拟机高可用技术对主机和业务系统性能影响等更深层次的研究,是运维管理人员应进一步学习提高的地方。

参考文献

1.《VMware_FT容错原理与配置详解》

https://blog.51cto.com/jobandjob/1251102;

2.《vSphere 高级特性FT配置与管理》

https://www.cnblogs.com/reachos/p/11221671.html;

3.《为虚拟机提供 Fault Tolerance》

https://docs.vmware.com/cn/VMware-vSphere/6.5/com.vmware.vsphere.avail.doc/GUID-7525F8DD-9B8F-4089-B020-BAA4AC6509D2.html;

4.《VMware-Fault-Tolerant Virtual Machine--论文翻译》

https://www.cnblogs.com/backkom-buaa/p/13505588.html

作者简介:

胡磊(1987-),男,汉族,湖北省武汉市人,副主任,空军预警学院 教研保障中心 信息技术室,2009年从事信息化建设工作至今已有14年时间。

 1 / 4