基于WiFi嗅探数据的地铁网络客流分析技术

(整期优先)网络出版时间:2018-12-22
/ 2

基于WiFi嗅探数据的地铁网络客流分析技术

黄亮

中国中铁集团上海华铁工程咨询有限公司上海市200000

摘要:随着地铁网络运营规模的拓展和客流需求的激增,网络运营面临常态或突发事件下的大客流压力,对客流流量和流向的多方位全过程监测将成为提升网络运营安全和效率的关键。AFC(自动售检票)系统可以得到乘客的进出站刷卡数据,但由于网络出行路径的多样性和出行过程的动态性,AFC刷卡数据无法准确获取每位乘客的出行路径,因此只能通过模型清分的方式在宏观层面对客流量进行统计分析。为快速、准确地检测个体乘客在轨道交通网络上的移动路径及聚类特征,视频检测和手机信令等新技术开始在不同应用场景得到探索和尝试。这些技术手段在宏观层面或特定局部区域应用有一定的价值,但由于现有技术的瓶颈,其尚不能很好地解决地铁网络客流分布和乘客个体出行路径的高精度识别问题。WiFi嗅探数据是探针设备与WiFi设备(如手机、平板电脑等)的交互信息数据,可以实现对携带WiFi设备对象的动态跟踪,从而解决红外检测和视频检测难以追踪对象的问题。

关键词:地铁网络;WiFi嗅探数据;客流特征;客流分析

引言:

对地铁网络中客流流量和流向的多方位全过程动态监测是提升网络运营安全和效率的关键,也一直是网络化运营中的难点问题。WiFi嗅探数据可以对携带WiFi设备的对象进行动态跟踪,实现乘客出行时空轨迹的精准化识别。为此,在接下来的文章中,将围绕基于WiFi嗅探数据的地铁网络客流分析技术方面展开详细分析,希望能够给相关人士提供参考价值。

一、WiFi嗅探数据采集内容简析

(一)技术原理

WiFi嗅探技术是运用WLAN(无线局域网)技术实现接入设备的定位,即在无线接入的同时能够判定接入设备的位置。WiFi嗅探数据的采集原理为:AP高频率地向四周广播发送Beacon帧(信标帧),用来通知附近的WiFi设备,通知AP的存在;同时,WiFi设备(如手机、平板电脑等)也会不停地发送probe帧(探测帧),去寻找附近可用的AP。在probe帧的数据包里包含了设备的MAC地址。当AP接收到WiFi设备发送的probe帧后,就获取了这个设备的MAC地址。因此,只要在WiFi探针覆盖区域内的设备打开WiFi,探针就能收集到该设备的MAC地址。设备与AP布设位置的距离可通过RSSI(接收信号强度指示)这个指标来反馈。RSSI值还与AP的功率及环境的干扰有关。WiFi设备定位的精度与AP布设的密度有关。以某地区轨道交通网络为例,AP分为两类,一类为固定AP,主要布设于车站站厅、站台和换乘通道内;另一类为移动AP,布设在列车各节车厢内。乘客携带打开WiFi功能的设备进入车站,会先后被布设在站厅、站台、车厢等的AP采集到,AP按平均2min的间隔将采集到的嗅探信息连续上报至中央服务器。

(二)WiFi嗅探数据的采集与转换

WiFi嗅探数据从采集到可用,需经过数据采集、数据清洗、数据标准化处理和数据入库四个过程。数据采集是AP服务器接收上报数据(包括AP的MAC地址、WiFi设备的MAC地址、采集的日期时刻等信息)后生成流文件,数据处理服务器定期扫描流文件,如果发现新的文件则启动数据处理任务,然后结合固定或移动AP位置的标签信息,转换成结构化数据。数据清洗包括数据去重、有效MAC地址识别、MAC地址加密、数据匹配、量纲统一,以及时间同步性效验等过程。数据标准化处理包括格式转换、赋缺省值、类型变换、代码转换、特定字符转换等。数据入库是将标准化处理后的乘客轨迹数据存入数据库服务器中,以供日后长期存储和后期加工用。

(三)WiFi轨迹数据的基本属性

WiFi嗅探数据转换后可以得到乘客的原始轨迹数据,包括WiFi设备的MAC加密地址、数据抓取的日期和时刻、车站名称、设备位置、线路编号、车体编号、车厢编号等基础信息。

二、WiFi嗅探数据存在的问题分析

第一,数据采集与上报数据的缺失与重复问题。上海轨道交通目前布设的AP中,存在一些AP(包括列车AP)的嗅探数据无法成功上报至服务器的情况;另外,上报的数据中也有无法识别的AP信息,同时还有大量数据重复上报(约占总数据的1/4)。第二,数据样本问题。部分乘客有可能没有携带WiFi设备,或者携带设备的WiFi功能没有打开,或者设备在中途打开或关闭了WiFi功能,这些情况会导致此部分乘客的原始轨迹数据缺失或不完整。第三,iPhone随机码问题。IOS8.0版本以上的苹果设备在扫描AP时,手机向外发送proberequest帧时会随机生成MAC地址,只有当设备完成WiFi扫描并跟某一确定AP连接时才会给出真实的MAC地址,随机码会对同一轨迹对象的识别产生严重干扰。第四,非地铁乘客的干扰问题。在地面和高架站,AP很有可能采集到非地铁乘客的WiFi设备。

三、原始轨迹数据的分析方法

(一)原始轨迹数据处理流程

客流分析的基础是要还原每位乘客的出行链路。由于原始轨迹数据的不完整性,且原始轨迹数据中有可能包括了多次出行过程,因此,针对出行链路的原始轨迹数据处理流程是:首先对原始轨迹进行链路识别与拆分,然后通过数据补全等方法还原每次出行完整结构化的出行轨迹[1]。

(二)轨迹数据的分析

首先,出行阶段识别。乘客出行由若干阶段组成,依据地铁内乘客的出行行为,可将乘客的每次出行过程分解为进站、候车、上车、乘车、下车、换乘和出站等7个阶段。乘客在不同出行阶段的轨迹特征是不同的,如上下车过程需要与列车运行的交路以及到发时刻进行匹配,换乘过程需要结合车站的拓扑结构和换乘组合形式来确定;其次,出行次数判别与拆分。针对单个乘客出行轨迹中可能包括多次出行的情况,需要对每一次的出行过程进行识别与拆分。乘客出行过程中,通常情况下后一次出行与前一次会有一定的时间差,如果两条连续的轨迹衔接时间长度超过了,则可以判定为后面的轨迹为另一次出行过程;如果后一连续轨迹与前一连续过程发生在同一条线路,但列车的运行方向相反,则不论两条轨迹的衔接时间是多长,可将后面的轨迹判定为另一次出行过程;再次,乘客完整的出行轨迹还原。针对不完整的乘客出行轨迹,可以结合出行阶段和状态,建立乘客与车站和列车的时空关联模型。结合采集的轨迹序列,通过设计相应的算法,对乘客进站、候车、上车、乘车过程、下车、换乘、出站的全过程轨迹进行还原;最后,区域人数的计算。基于完整的乘客出行轨迹,可以计算出各车站的分时进出站客流、各换乘站不同换乘方向的分时换乘客流、各站台和站厅的分时聚集客流、站台的上下车和候车客流、列车载客人数与满载率、分车厢的人数等客流指标[2]。

结论:

基于乘客在地铁网络中的出行时空轨迹识别,进一步得到网络客流在时间和空间上的流量和流向,一直是网络化运营中的难点问题。文章主要对某地区轨道交通网络获取的WiFi嗅探数据进行了初步分析,从分析结果来看,目前WiFi嗅探数据的采集和转换加工的技术条件已经具备,从采集的数据质量来看也能满足客流特征分析的要求。但由于样本数量、数据缺失等问题,再加上网络结构复杂、客流量大,针对数据的加工处理、数据还原、数据的深度挖掘仍然面临诸多挑战,这也是未来研究的重点方向[3]。

参考文献:

[1]胡斌杰,詹益旺.基于手机信令的道路交通流量状态识别及预测[J].移动通信,2017,39(10):17-27.