手机上网业务质量端到端分析方法和系统

(整期优先)网络出版时间:2016-12-22
/ 2

手机上网业务质量端到端分析方法和系统

刘浩锋陈伟雄

中国移动通信集团广东有限公司东莞分公司523129

摘要:为保障客户的上网体验,需要建立一套贴近客户感知的业务质量评估体系;需要贯通手机上网“端管云”各个环节,分析定位质差问题、开展优化提升。本文介绍了一种手机上网业务质量端到端的分析方法,基于4G信令构建业务感知评估体系,通过业务端到端分析模型定界到业务质差环节。

关键词:手机上网质量;端到端;分析方法

4G网络的普及推动了移动数据业务的快速发展,手机上网感知成为影响客户体验的主要因素。传统的网络质量评价体系只关注网络侧指标,不能涵盖手机上网的所有环节,特别是终端和内容源;同时手机上网业务种类丰富,复杂性远非传统话音业务可比,所以传统的网络质量评价体系已经不能满足4G数据业务运营的需求。为此急需建立一套贴近客户感知的业务质量评估体系;急需贯通手机上网“端管云”各个环节,分析定位质差问题、开展优化提升,实现手机上网感知的可视、可控、可分析、可溯源。

一、手机上网业务技术方案

1、系统框架

采集4G信令,在海量数据基础上,建立业务感知评估体系,形成业务端到端分析方法并进行业务质量保障和提升。整体思路以客户4G热点业务感知为重点保障对象,开发端到端业务质量分析模块,通过“发现热门业务”、“监测热点业务质量”、“业务质差环节自动定界”、“质差问题整改”四大步骤做好4G业务

质量保障工作。同时开展两项专题工作:挑选微信、AppStore等4G热点业务开展内容源精细化质量提升;筛选视频业务质差TOP小区,以周粒度开展无线专项整改。

2、业务感知评估体系

分析手机上网关键信令交互流程确定指标算法,目标建立贴近客户上网业务感知的评估体系。通过研究发现一般手机上网业务流程分解为3个阶段:DNS解析阶段、TCP握手阶段、HTTP业务阶段。DNS解析阶段手机应用将用户访问的域名翻译成访问服务器的地址;TCP握手阶段手机应用通过三步握手和访问服务器建立TCP管道连接;HTTP阶段手机应用在已建立的TCP管道之上通过HTTP方法获取到待访问的资源。基于上述三个业务阶段的信令关键点定义指标算法。考虑不同业务类型客户的指标敏感度差异,区分网页浏览、视频、即时通信、应用下载四大类业务共设置16个感知评估指标。

3、分析定界方法

针对业务感知评估指标劣化问题,按手机上网业务3个阶段分步分析,应用4种方法准确定位端到端5类问题。业务端到端分析定界方法围绕业务发生的3个阶段开展,即分解为DNS解析阶段分析、TCP握手阶段分析和HTTP业务阶段分析。每个阶段区分成功率类问题、时延类问题和速率类问题,运用一种或多种方法,最终定位问题。针对成功率类问题运用失败码定界法和横向对比定界法展开分析。

针对具体的问题阶段,结合失败原因、聚焦到问题的一个或多个发生环节;然后针对可疑环节,运用横向对比法定位到具体的设备。以DNS失败原因

码为2#为例,该原因码协议定义为服务器出错,则可以直接判定为DNS服务器问题;接下来则在DNS服务器IP维度横向对比、定位到具体的服务器IP。以DNS失败原因为无响应为例,发生此类问题可能是DNS服务器未响应也可能是DNS服务器回了响应但核心网分组丢失;接下来则需要在DNS服务器维度和核心网元维度开展分析,最终定位问题。

针对时延类问题运用分段定界法和横向对比定界法展开分析。以TCP握手阶段的时延问题为例,首先运用分段定界法判定是TCP一二次握手时延偏长还是TCP二三次握手时延偏长。如TCP一二次握手时延偏长说明问题发生在S1-U口以上路径,可能是核心网问题也可能是内容源侧问题;如TCP二三次握手时延偏长说明问题发生在S1-U口以下路径,可能是无线网络问题也可能是特定终端或用户行为。针对上述可疑环节,运用横向对比法定位到具体的设备。对于速率类问题,则直接运用横向对比法进行核心网、小区、内容源、终端等维度的聚类对比,并关联各维度的TCP管道质量,最终定位具体的问题。TCP管道质量重点考虑TCP乱序率和TCP重传率指标。

二、手机网页浏览业务分析方法

以某网页浏览业务响应成功率低分析定界为例,说明分析步骤:

步骤1:DNS解析阶段分析,发现DNS解析成功率达标,则进入TCP握手阶段分析。

步骤2:TCP握手阶段分析,发现TCP握手成功率达标,则进入HTTP业务阶段分析。

步骤3:HTTP业务阶段分析,发现HTTP响应成功率仅80.34%,则需要进一步分析HTTP响应成功率偏低的原因。

步骤4:HTTP失败原因码分析,发现HTTP无响应失败占比较高。该类失败可能是内容源服务器无响应,也可能是内容源服务器有响应但响应报文在核心网以上网络丢失,因此问题聚焦到内容源服务器侧和核心网侧。

步骤5:以核心网网元维度分析,发现各SGW无响应失败占比分布均匀,说明问题不在核心网,而是核心网以上。

步骤6:以服务器维度分析,发现特定内容源服务器访问量较高且无响应失败占比较高。问题最终定位为内容源服务器问题。

三、手机上网业务质量端到端应用分析

1、业务端到端分析业务端到端分析包含三大部分:热点业务挖掘、热点业务感知指标监测和业务质差端到端定界。

基于业务流量和用户渗透率综合排名挑选热点业务开展业务感知指标监测和端到端优化保障。共挑选出微信、淘宝、腾讯视频、优酷视频、爱奇艺、AppStore等50个热点业务,上述业务总流量达全网流量63%、用户渗透率达96%,符合优选标准。对挑选出的热点业务开展业务感知指标的实时监测预警,同时固化业务端到端分析定界方法,以思维导图方式展现分析定界结果。百度手机助手下载业务KQI指标监测,发现该业务下载成功率低于阈值,系统触发预警。系统基于固化的规则自动定界出F上海大众-2等30个质差小区和3个内容源服务器问题。

2、内容源专项优化

针对微信、AppStore等热点业务开展内容源专项优化。

2.1微信分析

4G数据统计,微信流量占现网总流量11%、用户渗透率达87%,属于高流量高用户渗透率业务。精细化识别和分析微信用户行为,发现微信朋友圈业务用户多、流量大,游戏类业务虽然流量小但是用户多、粘性高。将微信朋友圈质量、微信游戏质量作为微信精细化质量分析的重点分析对象。以微信朋友圈质量分析为例,发现微信图片服务器mmsns.qpic.cn域名响应成功率不达标,统计该服务器域名失败原因分布,发现无响应失败占92%、5XX失败占5%、4XX失败占3%,主要问题集中在内容源侧,优化后指标恢复。

2.2AppStore分析

苹果终端现网终端占有率排名第一、AppStore用户渗透率为28%。从系统监测的业务感知指标以及客户反馈情况AppStore业务感知不佳,因此对AppStore的内容源质量开展专项的分析和改进工作。分析发现AppStore部分域名被调度到网外且业务感知指标不达标。针对问题服务器关联服务器链路带宽监测指标,协调CDN厂家进行扩容并优化调度策略、同时通过手机缓存加速同步缓解CDN服务压力。优化后AppStore整体业务感知指标达标、质差流量由原来的28%下降到1%以内。

3、视频下载速率质差小区专项优化

筛选视频业务质差TOP小区,以周粒度开展无线专项整改。为排除内容源影响因素优选优质视频业务进行小区视频下载速率指标汇聚,考察周期为一周,选取每天8:00~23:00时,即7×16h为考察时段,筛选出一天中出现≥3h、视频下载速率≤1Mbit/s且该小时视频流量≥5MB的小区判定为视频业务质差小区,按每周质差问题天数、质差小时数选取TOP30质差小区开展优化整改。解决率76%,已解决的小区视频下载速率由571.62Kbit/s提升至2.66Mbit/s。

结束语:基于4G信令分析的业务感知评估体系,从客户使用角度出发,不局限于网络质量,而是考虑了终端、内容源等业务访问的其他环节的交互流程。相较传统以网络设备为中心的监测机制,更贴近客户感知。本文对业务端到端分析定界模型,按业务发生的3个阶段、运用4种基础算法、定界到手机上网5大关键环节,为业务质差问题的分析改进提供了有效支撑。

参考文献:

[1]罗文红,王兵.基于1xEV-DO网络的移动互联网业务端到端分析优化方法研究[J].移动通信,2013(20).

[2]杨晓峰.基于端到端业务模型的电信性能监控系统的研究和实现.北京邮电大学,2008(12)

[3]叶青,安瑞虹.基于移动互联网的业务质量和用户感知评测方法研究[J].邮电设计技术.2014(09)

[4]唐志军,刘宏立.通用移动通信系统的业务质量[J].信息技术与标准化.2003(03)