- 收藏
- 加入书签
基于 N4 接口探测降低 UPF 倒换时延的技术研究
摘要:随着 5G SA 网络的大规模商用,5G 业务呈现出爆发式的增长态势。企业和个人对业务系统的依赖程度与日俱增,这使得业务的连续性和灾难保护的重要性愈发凸显。在 5GC 核心网中,UPF 作为负责用户业务数据转发的关键网元,其故障倒换时延对业务的稳定运行有着重大影响。本文深入探讨了 N4 接口检测机制,着重介绍了基于 N4 接口探测降低 UPF 倒换时延的方法及其优势。通过对该技术的原理、关键参数以及实际应用效果的分析,论证了此方法能够有效满足垂直行业客户对低倒换时延的要求,为 5G 网络的可靠运行提供了有力的技术支撑。
关键词:5G SA 网络;UPF 倒换时延;N4 接口探测;PFCP 协议;业务连续性
一、引言
1.1 5G 业务发展现状
近年来,5G 技术凭借其高速率、低时延、大容量等显著优势,在全球范围内得到了广泛的应用和推广。5G SA 网络的商用,更是为各类新兴业务的发展提供了坚实的基础。从智能交通、工业互联网到远程医疗、高清视频等领域,5G 业务正以前所未有的速度改变着人们的生产和生活方式。
1.2 业务连续性的重要性
随着 5G 业务的快速发展,企业和个人对业务系统的依赖程度越来越高。对于许多行业来说,业务的连续性直接关系到生产效率、经济效益甚至生命安全。例如,在车联网中,车辆的自动驾驶、实时通信等功能都依赖于稳定的网络连接;在工业自动化生产线上,设备的远程控制和数据传输也需要保证网络的可靠性。因此,保障业务的连续性成为了 5G 网络建设和运营过程中必须解决的关键问题。
1.3 UPF 在 5GC 核心网中的作用
在 5GC 核心网中,UPF 作为用户面网元,承担着用户业务数据的转发任务。它负责将终端设备与外部数据网络之间的数据进行高效、准确的传输,是实现 5G 业务的重要环节。为了提高网络的可靠性和可用性,UPF 通常采用组 POOL 方式进行部署。当 POOL 内其中一台 UPF 发生故障时,需要及时将业务倒换至其他正常工作的 UPF,以确保业务的连续性。
二、技术产生背景
2.1 传统 UPF 故障检测方式及问题
现阶段,通常基于基站和 UPF 之间的 N3 接口来发现 UPF 故障。这种检测方式主要是通过 GTP 协议中的 ECHO 消息来探测 N3 接口链路是否正常。当基站在一定时间内未收到 UPF 对 ECHO 消息的响应时,就判定 UPF 可能出现故障。此时,基站会触发终端重新注册,让终端选择其他正常的 UPF 来恢复业务。
然而,这种基于 N3 接口的检测方式存在明显的局限性。倒换时延主要由链路探测时延和终端重注册时延组成。由于链路探测需要一定的时间周期,而且终端重新注册过程涉及到复杂的信令交互和网络资源分配,导致业务恢复时延通常超过 1 分钟。对于一些对时延敏感的垂直行业客户来说,这样的倒换时延是无法接受的,严重影响了业务的正常运行。
2.2 垂直行业对低倒换时延的需求
随着 5G 技术在各个行业的深入应用,垂直行业对网络的性能和可靠性提出了更高的要求。例如,在车联网中,车辆的自动驾驶需要实时获取道路信息和其他车辆的动态数据,任何网络中断或延迟都可能导致严重的安全事故;在工业互联网中,远程设备的控制和监测需要毫秒级的响应时间,以确保生产过程的稳定性和高效性。因此,垂直行业迫切需要一种能够降低 UPF 倒换时延的技术,以满足其对业务连续性和低时延的严格要求。
三、N4 探测技术详解
3.1 5G 网络中 SMF 和 UPF 的部署架构
为了保证网络的可靠性和业务的连续性,5G 网络中 SMF 和 UPF 通常采用组 POOL 方式进行建设。在这种架构下,POOL 内的 SMF 和 UPF 通过 N4 接口实现全互联。这种全互联的方式使得 SMF 能够实时监测 POOL 内所有 UPF 的运行状态,并在需要时进行灵活的资源调配。
3.2 N4 接口及 PFCP 协议概述
N4 接口采用了 3GPP 标准中定义的 PFCP 协议。PFCP 协议是 5G 系统中控制面功能 SMF 和用户面功能 UPF 之间的重要接口协议,它主要用于传输 SMF 和 UPF 间的控制面及用户面信息。通过该接口,控制面和用户面能够紧密配合,完成用户面规则下发和隧道建立等关键功能,确保用户业务数据的准确转发。
3.3 PFCP 协议中的心跳机制
在 PFCP 协议中,SMF 和 UPF 两端节点之间通过心跳探测消息 PFCP Heartbeat Request/PFCP Heartbeat Response 来探测通信路径和对端设备是否工作正常。当 UPF 与 SMF 建立关联时,SMF 会周期性地向 UPF 发送 PFCP Heartbeat Request 消息。UPF 在收到该消息后,会及时返回 PFCP Heartbeat Response 消息。SMF 通过判断是否在设定的时间周期内收到 UPF 返回的响应消息,来确认通信路径和对端设备的工作状态。
为了准确判断故障,通常设定 Th 为等待 PFCP Heartbeat Response 的最大时长。如果在 Th 时间内未收到响应消息,则认为未收到心跳响应消息。同时,设定 Nh 为第一次未收到心跳响应消息后需重发心跳探测消息的次数。若经过 Nh 次心跳探测均失败,则判断为 PFCP 链路故障。
3.4 PFCP 协议中的会话管理机制
除了心跳机制外,PFCP 协议还通过三对消息实现了 SMF 与 UPF 之间的 PFCP 会话管理,包括会话创建、会话修改和会话删除。具体来说,PFCP Session Establishment Request/PFCP Session Establishment Response 用于创建会话,PFCP Session Modification Request/PFCP Session Modification Response 用于修改会话参数,PFCP Session Deletion Request/PFCP Session Deletion Response 用于删除会话。
当 SMF 通过心跳探测发现某台 UPF 故障时,会主动使用 PFCP Session Deletion Request 消息将建立在该故障 UPF 上的 PDU 会话释放。同时,触发终端重新注册。在终端重新注册过程中,SMF 会使用 PFCP Session Establishment Request 消息为终端选择运行正常的 UPF 创建新的 PDU 会话,从而恢复终端业务。
3.5 影响 UPF 倒换时延的关键参数
在实际网络中,通过以下参数控制 N4 接口心跳探测周期,从而决定 UPF 故障时整体业务倒换时延:
1.N4 接口心跳探测周期 C:
指的是 N4 接口链路正常状态下 SMF 向 UPF 发送 PFCP Heartbeat Request 心跳探测消息的周期。如果心跳周期设置过短,会导致 N4 接口信令开销增大,接口负荷升高,影响网络的整体性能。通常建议心跳周期设置为 15 秒或 30 秒。
2.心跳消息重发间隔 Tr:
即心跳响应消息等待时间。当 SMF 超时未收到 UPF 心跳响应消息后,需要重发 PFCP Heartbeat Request 探测消息,Tr 就是两次重发之间的时间间隔。
3.心跳消息重发次数 Nr:
表示第一次心跳探测失败后最大重发尝试次数,也就是心跳检测连续异常的次数。当连续检测到心跳检测异常的次数达到 Nr 值时,则认为 N4 接口断链,UPF 故障。
4.SMF 释放会话时间 Dt:
指的是 SMF 判断 UPF 故障后释放相关用户会话所需的时间,包括无线资源释放、核心网会话释放等时间,约为 40ms。
5.UE 重注册时间 Rt:
即 UE 会话由于 UPF 故障被释放后重新注册网络,选择新的 UPF 创建会话所需的时间,平均时延为 450ms。
3.6 业务整体倒换时延计算公式及实例分析
由各参数定义及业务整体倒换时延构成图可知,通过 N4 接口探测 UPF 故障,其业务整体倒换时延计算公式为:
Tr * Nr + Dt + Rt ≤ T ≤ C + Tr * Nr + Dt + Rt
举例说明,当 C 取值设定为 30s,Tr 取值设定为 3s,Nr 设定为 5 次,Dt 实测均值为 0.04s,Rt 实测均值为 0.45s 时。则整体业务倒换时延为:
3 * 5 + 0.04 + 0.45 ≤ T ≤ 30 + 3 * 5 + 0.04 + 0.45,即 15.49 ≤ T ≤ 45.49。
由此可见,采用 N4 接口探测 UPF 故障,通过合理设置心跳周期、重发间隔、重发次数等参数,可将业务整体倒换时间控制在 60 秒以内,能够更好地满足对业务连续性和稳定性要求较高的业务需求。
四、N4 探测技术的优势
4.1 降低倒换时延
与传统的基于 N3 接口的探测方式相比,基于 N4 接口的探测技术能够显著降低 UPF 倒换时延。通过合理设置 N4 接口的心跳探测周期、重发间隔和重发次数等参数,可以在更短的时间内发现 UPF 故障,并及时进行业务倒换。从前面的实例分析可以看出,采用 N4 接口探测技术,业务整体倒换时间可以控制在 60 秒以内,大大提高了业务的恢复速度。
4.2 提高业务连续性
较低的倒换时延意味着在 UPF 发生故障时,业务能够更快地恢复正常运行,从而有效减少了业务中断的时间。这对于那些对业务连续性要求极高的行业来说,具有至关重要的意义。例如,在车联网和工业互联网中,业务的连续性直接关系到生产安全和经济效益。N4 探测技术能够保障这些行业的业务在 UPF 故障时仍能稳定运行,提高了整个系统的可靠性和稳定性。
4.3 减少误判概率
在传统的基于 N3 接口的探测方式中,由于链路探测和终端重注册过程的复杂性,容易出现误判的情况。例如,在网络信号短暂波动时,可能会导致基站误判 UPF 故障,从而触发不必要的终端重新注册过程。而 N4 接口探测技术通过 PFCP 协议的心跳机制和会话管理机制,能够更准确地判断 UPF 的运行状态,减少了误判的概率,避免了不必要的业务中断和资源浪费。
五、实际应用案例分析
5.1 车联网应用案例
在某城市的车联网试点项目中,采用了基于 N4 接口探测降低 UPF 倒换时延的技术。在项目实施前,由于 UPF 倒换时延较长,车辆在行驶过程中偶尔会出现网络中断的情况,影响了自动驾驶和实时通信等功能的正常运行。
项目实施后,通过合理设置 N4 接口的心跳探测周期、重发间隔和重发次数等参数,将 UPF 倒换时延控制在了 30 秒以内。在实际测试中,即使在 UPF 发生故障的情况下,车辆的网络连接也能在短时间内恢复正常,确保了自动驾驶和实时通信等功能的稳定运行。这不仅提高了车辆行驶的安全性,也为车联网的大规模应用提供了有力的技术支持。
5.2 工业互联网应用案例
在某工厂的工业互联网改造项目中,引入了基于 N4 接口探测的 UPF 故障检测和倒换技术。改造前,由于 UPF 倒换时延过长,远程设备的控制和监测经常出现延迟和中断的情况,影响了生产效率和产品质量。
改造后,通过优化 N4 接口的相关参数,将 UPF 倒换时延降低到了 20 秒以内。在实际生产过程中,即使 UPF 出现故障,远程设备也能迅速切换到其他正常的 UPF,保证了生产过程的连续性和稳定性。同时,减少了因网络中断导致的设备损坏和生产停滞,为企业带来了显著的经济效益。
六、技术挑战与解决方案
6.1 信令开销问题
虽然 N4 接口探测技术能够有效降低 UPF 倒换时延,但如果心跳周期设置过短,会导致 N4 接口信令开销增大,接口负荷升高。这可能会影响网络的整体性能,甚至导致网络拥塞。
为了解决这个问题,可以根据网络的实际情况,合理设置心跳周期。例如,在网络负载较轻的时段,可以适当缩短心跳周期,以提高故障检测的及时性;在网络负载较重的时段,可以适当延长心跳周期,以减少信令开销。同时,可以采用智能的信令优化算法,对心跳消息进行压缩和优化,进一步降低信令开销。
6.2 误判问题
在传输/承载网闪断、网络升级/倒换等信令面闪断场景下,如果 Tr * Nr 设置过短,可能会触发 UPF 用户会话被强制删除,造成用户面频繁切换,反而对业务连续性造成不良影响。
为了解决误判问题,可以根据网络的稳定性和历史故障数据,合理设置 Tr 和 Nr 的值。同时,可以引入机器学习算法,对网络状态进行实时监测和分析,提高故障判断的准确性。例如,通过对网络流量、信号强度等参数的分析,判断是否为真正的 UPF 故障,避免因信令面闪断等原因导致的误判。
6.3 兼容性问题
在实际应用中,N4 接口探测技术需要与现有的 5G 网络设备和系统进行兼容。不同厂家的设备和系统可能存在一定的差异,这可能会导致技术的实施和应用受到限制。
为了解决兼容性问题,需要加强设备厂家之间的合作和标准化工作。制定统一的技术标准和接口规范,确保不同厂家的设备和系统能够相互兼容。同时,在技术实施过程中,需要进行充分的测试和验证,及时发现和解决兼容性问题。
七、展望
7.1 与其他技术的融合
未来,基于 N4 接口探测降低 UPF 倒换时延的技术可能会与人工智能、大数据、区块链等技术进行融合。例如,通过人工智能算法对网络故障进行预测和预警,提前采取措施避免故障的发生;利用大数据技术对网络运行数据进行分析和挖掘,优化 N4 接口的参数设置;借助区块链技术提高网络的安全性和可靠性。
7.2 在 6G 网络中的应用前景
随着 6G 技术的研究和发展,网络对业务连续性和低时延的要求将更加严格。基于 N4 接口探测降低 UPF 倒换时延的技术在 6G 网络中具有广阔的应用前景。在 6G 网络中,可能会出现更多对时延和可靠性要求极高的业务,如全息通信、智能交通等。该技术可以为这些业务提供可靠的网络保障,确保业务的稳定运行。
7.3 技术的进一步优化和发展
随着网络技术的不断进步,基于 N4 接口探测降低 UPF 倒换时延的技术也将不断优化和发展。例如,进一步降低心跳周期和重发间隔,提高故障检测的及时性;优化会话管理机制,减少 SMF 释放会话时间和 UE 重注册时间;引入更先进的故障诊断和恢复技术,提高系统的自愈能力。
八、结论
本文详细介绍了基于 N4 接口探测降低 UPF 倒换时延的技术。通过对该技术的原理、关键参数、优势、实际应用案例以及面临的挑战和解决方案的分析,我们可以得出以下结论:
基于 N4 接口探测降低 UPF 倒换时延的技术是一种有效的解决方案,能够显著降低 UPF 倒换时延,提高业务的连续性和稳定性。通过合理设置 N4 接口的心跳探测周期、重发间隔和重发次数等参数,可以将业务整体倒换时间控制在 60 秒以内,满足垂直行业客户对低倒换时延的要求。
虽然该技术在实际应用中还面临一些挑战,如信令开销、误判和兼容性等问题,但通过采取相应的解决方案,可以有效克服这些问题。未来,随着技术的不断发展和完善,基于 N4 接口探测降低 UPF 倒换时延的技术将在 5G 网络以及未来的 6G 网络中发挥更加重要的作用。
参考文献
[1]3GPP. 3GPP TS 23.501 V16.6.0 (2020 - 09) - System Architecture for the 5G System; Stage 2 [R].
[2] 3GPP. 3GPP TS 29.244 V16.4.0 (2020 - 06) - PFCP (Protocol for Carrying Policy and Charging Rules) [R].
[3] 赵慧玲,5G 核心网技术与标准 [M]. 人民邮电出版社,2020.
[4] 张平, 5G 移动通信网络架构与关键技术 [M]. 机械工业出版社,2019.
作者简介:
甄振微(1983年10月),女,汉族,河北省石家庄人,副高级工程师,大学本科,主要研究方向:5G 2B及物联网运维
京公网安备 11011302003690号