人口热力大数据在应急管理领域的应用研究

(整期优先)网络出版时间:2024-05-13
/ 3

人口热力大数据在应急管理领域的应用研究

Research on population thermal big data in the field of emergency management

1李琪、2臧莹、3王立本

中国联合网络通信有限公司山东省分公司 ChinaUnicom Co., Ltd. Shandong

山东 济南 250014

摘要:《应急管理信息化发展战略规划框架(2018-2022年)》中明确要求依托对应急管理、安全生产、自然灾害等领域的灾害防治技战法研究,提高风险监测预警、应急指挥保障和智能决策支持等能力。在应急管理领域如何提前预警及识别各类灾害,实时掌握应急事件影响的动态,精准的进行预警发布及救援部署均成为现代应急管理领域探索的重点。依托运营商手机信令,以大数据分析能力为支撑,充分运用大数据整合及算法模型构建能力,围绕自然灾害中“人”、“地”维度进行大数据辅助决策分析建模,以用户为中心,可以提供个性化的灾害态势分析、救援态势分析、事后辅助灾情核定、事前事后预警信息靶向发送。

关键字:大数据、人口热力、应急预警、靶向信息、辅助决策

1研究背景

《山东省重大突发事件应急保障体系建设规划(2020-2030)》中明确要求加快运用科技信息化手段,推进云计算、大数据、物联网、区块链、人工智能、移动互联、北斗导航等信息技术在应急领域广泛应用,增强信息产品和服务供给能力,着力提升应急管理核心能力。《数字山东发展规划(2018-2022 年)》提出围绕应急指挥、平安山东、防灾减灾、环境资源、智慧交通、信用治理等领域,加快构建“数据汇聚、在线监测、事中监管、协同联动”一体化社会治理体系,推动治理模式由低效到高效、被动到主动、粗放到精准变革。

传统应急管理领域已经开展了相应的信息系统建设及大数据的应用,但更多是结合宏观气象、地质灾害、应急现场、监测设备等自然存在和物理设施的变化进行预测预警,缺乏围绕自然灾害中最关键的要素之一,针对“人”的大数据辅助决策分析和评估模型,缺少围绕人群大数据的事前人群预警分析,事中灾害态势分析、救援态势分析,事后的辅助灾情核定等大数据能力,无法将“地”、“人”等维度的大数据进行融合分析,提升辅助决策精准度。

在突发的应急场景中,保证人民群众的生命安全显得尤为重要。 应急大数据方案可在灾情发生及时告警灾情发生情况,实时监测灾情地区转移、安置、回流人员画像分析,灾后灾情核定分析,辅助决策制定救援计划。同时,可以辅助查看应急安置情况,安置地点分配及对应的转移人员数量及转移地,救援人员数量及救援来源地,救援人口画像等,优化灾后管理工作。

面对重特大突发事件发生前及发生后,缺乏针对特定区域及特定人群进行及时信息触达、靶向信息发送、信息反馈评估等响应覆盖。在应对极端天气、重大事件可能给安全生产经营、基础设施以及员工生命财产安全造成的严重威胁时,缺乏灾前预警和灾后救助信息传达。

2人口热力大数据简介

2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中将数据作为一种新型生产要素写入文件中,从此,数据的地位变成了与土地、劳动力、资本、技术等传统要素并列的第五生产要素,其重要性可见一斑。随着社会的发展,科技越来越发达,信息也更加的通畅,人与人之间的联系更加的密切频繁,海量的数据从中诞生,在这些海量的数据背后是巨大的价值,通过专业化的处理和挖掘,可以挖掘出隐藏在数据中的价值信息用于政务服务、企业发展和改善民生,利用数据为政府和企业决策者提供更有利的参考,实现精准的决策与服务。

本研究充分利用基础电信运营商脱敏的手机信令数据,运营商手机信令数据包括人口特征、位置驻留聚集、位置切换、行动轨迹等,具有样本量大、时间上连续性、空间上完整性、更新频率快等优点,采集大数据脱敏算法将数据进行脱敏,确保数据安全性的同时能够保障数据热力建模的有效性。采用大数据建模及分析技术,对人口的性别、年龄段、常驻等维度进行360°画像,通过对于信令的观察,动态地分析基站小区的关系,然后将信令与基站小区关系结合,判断用户是驻留聚集还是出行经过,并结合基站工参数据,基于GIS的地图服务划分网格(location)实现人口热力的精准分析和展现。

基于基础电信运营商的人口热力大数据能力,构建全省应急分析能力的基础底数平台、模型分析平台、应急靶向信息发送平台,为应急管理厅提供面向洪涝、火灾等自然灾害的受灾区域人群热力分析、人员异常变化分析、应急靶向信息发送等服务,以及针对特殊场景,如矿井周边的人员异常变化分析等大数据分析及辅助决策服务。

3人口热力大数据在应急领域的应用

3.1应用场景

充分利用运营商数据特点,根据不同的应急场景,制作相关专题的分析模型,形成一套有意义的模型分析体系、特定场景的指标口径、人口特征的建模方法。模型内容包括:受灾区域人口画像分析模型服务;因灾紧急转移人员灾后回流分析模型服务;受灾区域巡堤查险人员分析模型服务;因灾紧急转移人员所在区域分析模型服务;因灾紧急转移人员集中安置点分析模型服务;受灾区域人员异常流动变化监测分析模型服务;因灾紧急转移人员分析推送服务;因灾紧急转移人员集中安置点分析推送服务;因灾紧急转移人员灾后回流分析推送服务;受灾区域人员异常流动变化监测分析推送服务;关停矿井周边人员异常流动变化监测分析推送服务等。

同时,基于实时信令数据和精准模型算法,实现围栏数据实时过滤,根据不同场景、不同标签的规则,按预设条件精准圈定目标用户,自动发送短信。向辖区内居民、外来人口等特定人群发送政务宣传、应急指挥、安全预警、公益服务的信息发布应用。

3.2方案实施

本项目平台部署在山东联通内部,应急管理厅通过应用服务或接口的方式直接调取结果信息,通过建设人口热力大数据中台,通过数据采集、数据处理、数据建模、数据分析结果、数据推送、智慧信息触发等多种技术环节,最终形成人口热力大数据应用能力。将人口热力大数据应用能力和应急领域的场景深度融合,为应急领域提供准确、及时、完整的大数据服务。

具体应用实施工作涉及相关的数据、模型、软件等多方面的测试验收多个阶段,主要步骤包括以下内容:

1)数据采集:基于kafka的实时流技术,实时采集基础运营商脱敏后的信令数据和应急场景数据,包含山东联通全网、B域用户资料及话单数据、O域实时信令数据。

数据来源包含OSS系统、BSS系统、CBSS系统、集团DWA系统、集团终端库系统,每个系统数据对应不同的接口规范,由于数据源的多样化要求采集程序必须实现高可配性。数据接口举例如下:

源系统

中文名

英文名

接口号

分隔符

CBSS

用户表

TF_F_USER

CDNPRDE03004

0X01

CBSS

客户表

TF_F_CUSTOMER

CDNPRDE10014

0X01

BSS

集团客户

TF_F_CUST_GROUP

D01004

0X01

BSS

用户资源

TF_F_USER_RES

D01010

0X01

数据仓库DWA

CBSS订购实例组成员

DWA_V_D_CUS_CB_OM_DERIVE

CDBDSDWAL01005

TAB键

数据仓库DWA

cBSS出帐衍生信息(月)

DWA_V_M_CUS_CB_CHARGE

CMBDSDWAL03001

TAB键

终端库

五元组月数据

DW_R_USER_FIVE_MONTHLYALL_M

CMBBIDWAL11005

竖线

标签库

用户访问APP频次TOP10

TG_CDR_APP_TOP

CDMR011

竖线

 ……

 ……

 ……

 ……

 ……

2)数据处理:结合客户需求,针对不同的需求及数据类型,分别采用不同的处理技术。

海量离线计算技术Hive+MapReduce;实时数据处理技术Spark Streaming;结构化数据处理Mpp数据库。模型处理结果统一存储在Hbase数据库中,满足海量数据查询快速响应的需求。基于spark streaming技术,加工处理脱敏后的信令数据和应急场景数据,以实际需求为导向,以手机信令及管理数据为基础搭建紧急转移人员分析的主题库及专题库,为后续的数据模型提供基础;

完成DWA层处理的数据,可用来生成用户标签,数据挖掘,以及大数据应用平台的展现。其中,用户标签是中国联通对全网用户的基础信息和行为数据的归纳和分析结果,包括用户360°的属性特征和行为偏好。

用户标签产品能全方位的了解用户行为特征,为锁定潜在的目标客户全,营销决策等提供数据支撑。它是对客户行为数据与基本信息进行分析、归纳后,提炼出的客户行为特征或属性特征。标签值是对客户行为特征或属性特征的定性描述。

根据中国联通现有数据域的分类分布划分方式和业务需求,建立了一套完善的标签体系,通过对客户标签分类,使客户标签便于管理。现有的标签体系包含如下内容:

基础标签:从自然人的角度描述客户属性,以及相应的社会关系。

产品需求:用户订购联通产品信息,包括参与合约计划情况,以及客户对营销活动选择的倾向性信息。

业务特征:从语音、流量、短信等方面分析用户的使用情况。

消费特征:描述用户出账收入的构成、结算收支和账务相关的信息。

渠道特征:描述客户服务接触中的渠道及渠道偏好信息。

终端偏好:描述用户终端使用信息及终端偏好信息。

位置轨迹:记录用户行动和基站使用轨迹。

互联网内容偏好:对互联网内容进行分类,描述客户上网行为偏好。

用户标签可以用来实现用户标签信息的多维度查询,能够实现对开放平台内模型构建的标签支撑,还可以实现潜在目标用户群的精准定位和行业专属标签的定制等应用。具体来讲,在行业客户提供存量用户的身份识别信息(如手机号码、证件号码、设备号码等)后,可以通过详细标签信息查询,然后输出群体级的数据统计结果。在中国联通制定的数据空间内,根据不同的行业客户及业务场景需求,为专业化的模型构建提供基础标签支撑。其次,根据行业客户提出的业务需求,进行多维度的用户标签筛选,帮助行业客户找到潜在的目标用户群。依托现有的基础标签,根据不同行业的特殊需求,通过模型方法,构建不同行业的定制标签,实现行业专属标签的定制。

3)数据建模:综合分析数据特点和需求类型,依托K-Means等不同的数学算法搭建反应真实人员信息的数据模型,并通过不断的数据喂养,调整参数,优化结果。数据模型建立步骤如下:

第一步:在执行模型之前,实时获取模型任务需求,读取设定的任务参数传入模型。

第二步:实时采集用户最新的信令数据,使用异常轨迹数据处理算法剔除无效数据。

第三步:得到的有效信令数据进行预处理,用于归类统计。本模型中,考虑信令数据的间断缺失性,使用了数据沉淀方法对用户历史轨迹进行沉淀,同时考虑基站异常值情况,加入了孤立森林算法和垂直处理算法对结果进行优化。

孤立算法作为异常值检测算法的一种,既不需要定义数学模型,也不需要进行有标记的训练,具有很多优势,如处理效果好,运算效率高,具有很高的实用性,适合处理高维数据和大量数据。因此该模型选用孤立森林算法用于异常波动检测。

对于单个基站而言,人们每天的活动是存在规律的,所以信令数据量在不同天数 的相同时刻之间具有相似性。对于单个基站来说,不同天数同一时刻的基站人群密度数据之间一定有相似性。

4)数据分析结果:根据数据模型输出数据分析结果,并以可视化、API等不同方式进行呈现;

5)数据推送:制定数据同步频率,定制数据推送API,将数据分析结果推送至应急管理决策指挥系统等相关系统。

6)智慧信息触发:依据实际业务场景,预设靶向信息格式模板,设定触发规则,设计应急靶向信息发送流程。通过区域圈定人群,及时、精准、有效地将预警信息、通知信息和指导信息发送给目标人群,以实现提前预防,减少灾害发生时的人员伤亡和财产损失,同时及时的在灾后发送安全提醒信息,成为灾前预警和灾后救助待解决的问题

3.3方案优势

1)独创国家应急管理部平台与运营商信令大数据场景应用融合的统一口径及标准,可实现省市区级应急场景的连续性。

基于国家应急部的项目实践,借鉴应急部已形成一套应急管理行业认可的手机信令人口数据制作技术规范,从数据采集、指标确定、计算模型选择、数据计算、数据扩样、数据质检、成果验证等方面规范手机信令人口数据制作方法,统一有关数据制作口径。

2)唯一实现运营商海量数据全国一点集中,满足全国人口大数据流动分析呈现。

基础数据源在获取、处理和使用过程中需满足国家安全的法律法规;数据满足全国集中的特性,具备全国数据统一分析能力;数据具有明确的质量监管措施,保证对基础数据采集、加工、处理的真实性与准确性;具有一定的历史数据积累,便于数据对比、分析、校验,形成可靠的模型和方法论。按照手机信令人口数据制作技术规范,对年度数据和更新数据进行完整性检查、标准化处理、数据项补充、数据格式转换、数据建模等工作,形成满足空间规划等业务需要的人口大数据成果。

3)专题数据产品加工定制化。

针对应急管理、安全监管、自然灾害专题分析等需求,提取并优化了所需的手机信令人口数据,能够满足特定需求,直观、易懂的专题数据产品。

4)优化数据服务性能

信令处理与应用能够满足对全国信令数据进行清洗和加工,并使用数据仓库结构对产出的结果进行永久留存。具备充足的计算、存储资源,能够快速响应需求,同时对数据积累及综合分析服务空间进行管控治理。具备海量手机信令大数据数据存储、管理、计算等关键技术,对数据物理存储、数据压缩、数据缓存以及显示等一系列关键技术持续优化创新,具备高水平的海量空间数据的查询、浏览和调用速度。

5)挖掘数据价值

数据时间精度满足特定月份统计的要求,并且具备有数据年度更新的能力、人口空间分布的数据服务支撑能力。充分利用数据抽取-加载-转换ETL、OLAP等先进数据仓库技术,进行数据价值的分析、挖掘和多维展示。

4结束语

数据已经成为为土地、劳动力、资本同等地位的第五类生产要素,利用大数据赋能,结合应急场景下的数据分析模型,可以充分挖掘电信运营商数据、互联网数据价值,支撑各级党政、政府、应急主管部分、省有关部门对自然灾害、安全生产等突发事件进行综合研判、态势分析、辅助决策及应急靶向信息发送,充分发挥应急领域的大数据应用价值。