
- 收藏
- 加入书签
基于大数据的5G核心网双平面容灾倒换信令冲击模型研究
摘要:某省在5G核心网集中部署、双DC容灾的背景下,为保障极端故障场景下5G业务正常运行,进行了多次DC倒换测试。该研究通过采集倒换期间核心网信令面、数据面信息,创建故障场景下的信令冲击模型,供5GC日常网络扩容、流控部署参考。
关键词:5G核心网;信令冲击;容灾;大数据
1 研究背景
近年来运营商响应国家5G战略部署,充分发挥5G“新基建”作用集中部署5G网络。商用以来广泛应用于物联网、车联网、自动化运营等项目,深刻改变人们的生产生活方式。
当前5GC核心网大部分采用双DC异局址部署方式容灾,因网络建设与业务正常匹配度问题,存在部分网元处理能力不足的瓶颈。故障场景下产生的信令冲击会因瓶颈的存在产生雪崩效应,大面积影响5G业务。
引起信令冲击的原因涉及终端行为、业务请求、45G互操作、定时器、流控参数等,对信令冲击的正向分析量化,需依赖冲击量的量化手段支撑。某省基于5GC DC级倒换数据分析建模,总结了故障场景下信令冲击模型,可为日常网络运维的扩容、流控部署提供参考。
2 数据采集
2.1采集需求
故障产生的信令冲击往往在秒级产生,主要来自于以下流程:
(1)用户主动发起业务,引起的网络冲击,包括4G/5G注册及激活;
(2)AMF/MME扫描引起的网络冲击,包括5G激活、4G附着及激活;
(3)45G互操作产生的网络冲击,包括4G激活及5G激活。
为精确分析信令冲击趋势,需采集秒级统计数据构建冲击模型。需求如下:
2.2采集及预处理
数据提取条件如下:
(1)4G用户附着请求次数:以S1-MME IP维度,根据XDR详单中‘流程类型’及‘流程成功标志’字段,在SEQ数据库中以SUM及CASE WHEN组合函数统计倒换期间MME每秒各流程业务次数;
(2)SMF作为PGW形态产生的激活请求次数:根据XDR详单中‘流程类型’为Service Request,以IMSI或MSISDN、SMF+PGW网元S5业务IP为维度,‘事物类型’及‘事物成功标志’字段以INTERFACEID=6限定S5接口,在SEQ数据库中以SUM及CASE组合函数统计倒换期间SMF网元每秒各流程业务次数;
(3)5G用户注册请求次数:根据XDR详单中‘流程类型’为Registration,以IMSI或MSISDN为维度,根据N2接口IMSI字段去重,在SEQ数据库中统计倒换期间N2接口Registration流程每秒上线用户数;
(4)5G用户激活请求次数:根据XDR详单中‘流程类型’为Service Request,以IMSI或者MSISDN、时间为维度,根据N2接口IMSI字段去重,在SEQ数据库中统计倒换期间N2接口Service Request流程每秒的上线用户数。
通过对提取后的数据进行关联、筛选,本文以某省数据分析建模,分析如下文所述。
3 5G信令冲击分析
3.15G注册冲击
DC1倒换后用户在DC2 AMF重新注册产生冲击,通过SEQ统计数据分析如下:
(1)00:29:26分完成倒换操作;
(2)00:30:22分冲击达到峰值,DC2 AMF用户注册请求峰值速率为2830次/秒,倒换产生冲击2110次/秒;
(3)峰值上线注册比例=倒换峰值冲击/故障AMF用户数,本次统计样本峰值上线注册比例为0.82%。
详细分析如图3.1所示,总共有2个波次的冲击:
3.25G激活冲击
DC1倒换后,用户在DC2 AMF激活产生冲击,通过SEQ统计数据分析如下:
(1)00:29:26倒换操作完成
(2)00:30:46达到冲击峰值,5G激活峰值6526个/秒,倒换产生激活冲击6521个/秒。
如图3.2共4个波次冲击:
4 4G信令冲击分析
4.14G附着冲击
倒换操作完成后,终端主动发起数据业务请求,同时针对因用户数据和语音会话都故障的用户,MME会通知UE重新附着恢复会话。分析发现4G附着冲击存在两个波次,如图4.1所示:
(1)第一波:用户主动发起业务引起附着冲击,0:30:37 4G附着峰值3277个/秒,倒换产生4G附着冲击2917个/秒;
(2)第二波:MME启动扫描语音故障用户,通知用户重新上线引起, PGW-C断开5分钟后倒换产生4G附着冲击920个/秒。
4.24G激活冲击
倒换完成后,终端主动发起数据业务请求,因PGW故障MME通知UE激活重建数据会话产生激活冲击。根据SEQ统计数据分析发现4G激活冲击存在两个波次,如图4.2所示:
(1)第一波:用户主动发起业务引起激活冲击,0:29:59 4G激活峰值5299个/秒,倒换产生4G激活冲击5237个/秒。
(2)第二波:MME启动扫描语音故障用户,通知用户重新上线引起,PGW-C断开5分钟后倒换产生4G激活冲击1752个/秒。
5 冲击模型构建
5.1 冲击趋势
故障或倒换产生信令冲击因受用户行为、网络特性等影响,会有多个波次的冲击,且冲击主要发生在第一个波次。结合多次倒换经验分析,AMF注册冲击出现在倒换后1分钟左右,SMF会话激活冲击出现在倒换后39秒左右,趋势基本相同。分析如下:
(1) 5G注册冲击:第一波冲击在倒换后52~60秒产生,因用户主动发起业务引起;第二波发生在倒换12分钟左右回落用户返回5G冲击,冲击呈逐步减退趋势。
(2) 5G激活冲击:第一波冲击在倒换后1分20秒~1分36秒左右产生,因用户主动发起业务引起;第二波由AMF注册成功后激活请求产生,较注册峰值晚1分钟;第三波冲击在倒换后3分钟后产生,由AMF扫描语音故障用户激活引起;第四波冲击发生在倒换后12分钟左右,由回落用户返回5G冲击引起。冲击呈逐步减退趋势。
(3) 4G附着冲击:第一波冲击发生在倒换后1分20秒~1分36秒左右,由用户主动发起业务引起;第二波冲击发生在倒换后5分钟,由MME启动扫描语音PDU故障用户上线引起。冲击呈逐步减退趋势。
(4) 4G激活冲击:第一波冲击发生在倒换后33秒至36秒之间,由用户主动发起业务引起;第二波冲击发生在倒换后5分钟,由MME启动扫描语音故障用户上线引起。
信令冲击故障或倒换后很快出现,故日常根据业务量及时评估冲击及时扩容、部署流控,保障网络安全。
5.2 上线模型
通过大数据分析发现用户注册、附着、激活冲击受用户主动业务请求,流控影响较大,各模型在相对范围内波动。上线模型如下:
(1) 5G峰值注册上线比例=峰值注册请求次数/AMF故障用户数,取值在0.69%~0.82%之间;
(2) 5G峰值激活比例=峰值激活请求次数/故障5G用户,取值在1%~5%之间;
(3) 4G峰值附着上线比例=峰值附着请求次数/(4G会话数/4G会话用户比),取值在0.42~0.55%/秒之间;
(4) 4G峰值激活比例=峰值附着请求次数/(4G会话数/4G会话用户比) ,取值在0.9~1.2%/秒之间。
5.3 冲击模型
通过分析故障冲击峰值出现在第一个波次,主要与用户数、业务场景、上线模型有关。按照5GC双DC容灾部署,需恢复的用户场景如下:
(1) 5G用户场景:
场景1:故障DC1 AMF上注册的用户。DC1 AMF故障后通过用户正常业务触发容灾恢复,转化成1个注册+2个PDU。
场景2:注册在DC2的AMF,但用户语音、数据PDU都在DC1。DC1故障后用户需要AMF扫描+主动上线容灾恢复。
场景3:注册在DC2的AMF,语音PDU在DC1,数据PDU在DC2。DC1故障后用户需要AMF扫描+主动上线容灾恢复。
场景4: 注册在DC2的AMF,数据PDU在DC1,语音PDU在DC2。DC1故障后,用户需要主动上线容灾恢复。
(2) 4G用户场景
场景1:数据故障+语音故障,由传统MME、SGW、DC1 SMF接管,语音+数据PDU都在DC1。DC1故障后用户容灾恢复:MME扫描(通知UE重新附着,建2个PDU)+用户主动上线。
场景2:数据正常+语音故障,由传统MME、SGW接管,用户语音PDU在DC1,数据PDU在DC2。DC1故障后用户容灾恢复:MME扫描(通知UE重新激活语音)+ 用户主动上线(SR,MME通过Deactivate通知UE,UE发起PDU重建语音)。
场景3:数据故障+语音正常,由传统MME、传统SGW接管,用户数据PDU在DC1,语音PDU在DC2。DC1故障后用户主动上线进行容灾恢复。
场景4:数据正常+语音正常,由传统MME、传统SGW、DC2 SMF接管,语音+数据PDU都在DC2。DC1故障后用户无影响。
(3) 冲击模型构建及验证:
结合大数据分析得出的上线模型及业务场景,构建冲击模型如表5.1所示:
根据上述模型获取45G注册/激活冲击数据后,可按照表5.2方法计算相关网元的冲击,匹配该网元的处理能力,配置合理的流控措施:
在故障发生后的实际冲击中,除本次模型考虑的输入外,还受终端行为叠加被流控后的重发、回落行为等影响。本研究依据多次倒换、多省SEQ系统海量数据分析反推及有限迭代得出,仍有不完善地方,随着数据量的积累及验证纠偏,精确度会逐步提高。
6 总结与展望
5G作为新一代信息通信技术领域的引领性技术,加速开启了万物互联新时代,是支撑经济社会数字化、网络化、智能化转型的关键信息基础设施,行业需求日新月异,与国民工作生活息息相关。
本研究通过数字化手段将网络冲击数据显性并归纳成数据模型,供日常运维参考,提高了5G核心网网络健壮性,取得了很好的实践效果。
参考文献
[1]李延斌. 5G核心网容灾方案及部署策略研究[J].邮电设计技术, 2021(09):80-81.
[2]陈玲,高和,郑盛. 5G用户及业务预测方法研究[J].邮电设计技术,2020(8):11-12.
[3]张国光,赵占强,许国平,孙宏,赵煜,褚旭. 5G网络维护自动化及优化智能化应用[J].邮电设计技术,2020(7):54-55.
[4]李一,刘光海,许国平,龙青良. 5G网络NSA与SA模式互操作策略研究[J].邮电设计技术,2020(6):55-60.
崔萍,毕业于北京邮电大学,工程硕士,高级工程师,主要从事移动核心网分组域、5GC网络运营及创新业务支撑工作。
张欣,毕业于西安邮电大学,工程硕士,高级工程师,主要从事移动核心网分组域、5GC网络运营管理及新业务新技术研究。
刘瑞,毕业于山东大学威海分校,高级工程师,主要从事移动核心网分组域、5GC网络运营及创新业务支撑工作。0
刘茂莲,毕业于重庆大学,学术硕士,工程师,主要从事移动核心网分组域和智能运维支撑工作。