近日,在泰國結(jié)束的第13屆全球移動寬帶論壇(MBBF 2022)上,如何抵御信令風(fēng)暴沖擊,保障業(yè)務(wù)永遠(yuǎn)在線,成論壇上最為關(guān)注的話題之一,獲得參展各方的熱烈討論。
兩年來,全球發(fā)生多起由于網(wǎng)絡(luò)異常引發(fā)的信令風(fēng)暴,從而導(dǎo)致全網(wǎng)業(yè)務(wù)長時間癱瘓,范圍波及中東、美洲、亞太的多家運營商。例如,2022年7月,加拿大R運營商發(fā)生大規(guī)模網(wǎng)絡(luò)中斷,時長約19個小時;同月,日本K運營商發(fā)生全網(wǎng)業(yè)務(wù)癱瘓,中斷時間長達(dá)62個小時。業(yè)務(wù)穩(wěn)定是通信產(chǎn)業(yè)的根基,網(wǎng)絡(luò)癱瘓不僅會造成運營商直接收入損失和巨額賠償,還會影響到運營商的品牌聲譽乃至生存發(fā)展。
深入剖析發(fā)生重大事故的通信服務(wù)商,都是網(wǎng)絡(luò)誤操作或者設(shè)備異常等原因引發(fā)網(wǎng)絡(luò)信令風(fēng)暴,信令網(wǎng)的收斂和保護(hù)功能不夠完善,網(wǎng)元收受到?jīng)_擊后無法快速恢復(fù),最終導(dǎo)致全網(wǎng)癱瘓。
隨著全球5G網(wǎng)絡(luò)建設(shè)高速發(fā)展,移動寬帶用戶和數(shù)據(jù)業(yè)務(wù)呈爆發(fā)式增長,5G網(wǎng)絡(luò)中的信令風(fēng)暴問題也日趨凸顯。
為什么5G時代,信令風(fēng)暴更頻繁?
1、技術(shù)方面
5G時代,核心網(wǎng)基礎(chǔ)設(shè)施開始從專用平臺向云化和分層解耦轉(zhuǎn)型。云化網(wǎng)絡(luò)在增加敏捷性的同時,也帶來可靠性的風(fēng)險;分層解耦帶來的多廠家協(xié)同部署網(wǎng)絡(luò),更容易引入健壯性不足的問題。
網(wǎng)絡(luò)架構(gòu)方面,為使5G網(wǎng)絡(luò)解耦和彈性擴容,大量網(wǎng)元功能被模塊化,這也增加了網(wǎng)元間的鏈路數(shù)量和信令網(wǎng)絡(luò)的復(fù)雜性。信令網(wǎng)是一個端到端的系統(tǒng)工程,涉及各個子模塊的韌性設(shè)計,以及全局的可靠性保護(hù)設(shè)置,信令網(wǎng)絡(luò)變得龐大和繁雜后,可靠性規(guī)劃往往難以面面俱到,容易出現(xiàn)各種網(wǎng)絡(luò)隱患。
2、 業(yè)務(wù)演進(jìn)方面
5G網(wǎng)絡(luò)基于SBA(基于服務(wù)架構(gòu))的軟件架構(gòu),在可路由性方面有所提升,但是在擁塞管理、路由實時負(fù)載均衡調(diào)配,以及可靠性保障等方面,存在很多不夠完善的地方。
通信網(wǎng)絡(luò)演進(jìn)到5G時代后,新業(yè)務(wù)層出不窮,網(wǎng)絡(luò)對信令消息數(shù)量、包長和處理能力有了更進(jìn)一步的的要求。新應(yīng)用上量后,網(wǎng)絡(luò)流量倍增,由于網(wǎng)元異常等原因引發(fā)的信令風(fēng)暴沖擊,強度相比過去將會翻倍,網(wǎng)絡(luò)后端用戶數(shù)據(jù)、計費、策略控制等業(yè)務(wù)網(wǎng)元承受到的信令浪涌壓力將前所未有,而這些網(wǎng)元一旦被信令風(fēng)暴沖垮,整網(wǎng)的業(yè)務(wù)就會中斷。
5G時代,如何增強網(wǎng)絡(luò)的可靠性?
1、基于SCP實現(xiàn)信令網(wǎng)架構(gòu)簡化,夯實網(wǎng)絡(luò)可靠性
3GPP在5G的第二個演進(jìn)版本R16中,引入SCP(服務(wù)通信代理)網(wǎng)元,定義了間接通信方式:模式C和模式D(如下圖所示)。
3GPP對5G網(wǎng)元信令交互方式定義了A/B/C/D四種模式
R15版本直接通信方式(模式A和模式B)和R16版本間接通信方式(模式C和模式D)的主要區(qū)別如下:
模式A:網(wǎng)元功能分為服務(wù)提供者和服務(wù)使用者,所有網(wǎng)元都直接相連。
模式B:增加NRF(網(wǎng)絡(luò)存儲功能)網(wǎng)元,提供服務(wù)發(fā)現(xiàn)和尋址,服務(wù)使用者使用服務(wù)前,先到NRF獲取服務(wù)提供者的地址。其他連接方式和模式A相同。
模式C:在R15版本基礎(chǔ)上,增加SCP網(wǎng)元,服務(wù)使用者去NRF尋址無需經(jīng)過SCP,獲得服務(wù)提供者的地區(qū)后,和服務(wù)提供者之間的信令交互都通過SCP路由和轉(zhuǎn)發(fā)。
模式D:在R15版本基礎(chǔ)上,增加SCP網(wǎng)元,服務(wù)使用者去NRF尋址需要經(jīng)過SCP,獲得服務(wù)提供者的地區(qū)后,和服務(wù)提供者之間的信令交互也通過SCP路由和轉(zhuǎn)發(fā)。
R16版本的模式C和模式D,在網(wǎng)元鏈路建立、路由信息獲取、整網(wǎng)流量轉(zhuǎn)發(fā)、控制管理和負(fù)載均衡等方面都有了升級,更有利于異常流量場景管控。
從簡化網(wǎng)絡(luò)角度來看,相比模式 A和B,模式D可實現(xiàn)90%以上的鏈路數(shù)量減少,均衡各個局向的實時負(fù)載,實現(xiàn)網(wǎng)絡(luò)連接簡化。相比模式C,模式D又能進(jìn)一步減少NF(網(wǎng)絡(luò)功能)間頻繁的訂閱和通知交互,降低網(wǎng)絡(luò)流量負(fù)荷,實現(xiàn)信令路由和負(fù)載均衡在SCP的集中化管理。
模式D引入后網(wǎng)絡(luò)拓?fù)渥兓?/P>
此外,模式D通過大幅減少網(wǎng)絡(luò)實時連接,降低網(wǎng)絡(luò)架構(gòu)復(fù)雜度,使信令網(wǎng)更容易維護(hù),故障可以快速定位。SCP的靈活對接還可以屏蔽異廠家網(wǎng)元間不同,大幅減少不同廠家網(wǎng)元對接時的集成工作量,縮短新業(yè)務(wù)上線時間,增強企業(yè)競爭力。
2、以高韌性、智能流控和快速恢復(fù)支撐可依賴信令網(wǎng)
今年7月,日本K運營商全網(wǎng)癱瘓事故的起因是路由器割接,割接失敗后操作回退,大量終端重新發(fā)起位置注冊消息,海量信令集中突發(fā),很快引發(fā)VOLTE節(jié)點和用戶數(shù)據(jù)節(jié)點擁塞。由于網(wǎng)絡(luò)架構(gòu)復(fù)雜且缺少自動化的流量控制手段,運維團隊的故障排查和恢復(fù)時間長達(dá)3天。
根據(jù)近年來的信令風(fēng)暴事故分析,90%以上事故的崩潰點都在網(wǎng)絡(luò)后端的用戶數(shù)據(jù)(HSS)/ 策略控制(PCF)/計費系統(tǒng)(CHF)等數(shù)據(jù)庫型網(wǎng)元。信令網(wǎng)SCP方案除了需要自身扛得住高強度流量沖擊外,還要有適配后端網(wǎng)元的處理能力,對前端流量進(jìn)行智能流控,削峰整流,保護(hù)后端HSS/UDM/PCF等關(guān)鍵網(wǎng)元,維持整網(wǎng)業(yè)務(wù)實時在線。
此外,SCP基于星型架構(gòu)的網(wǎng)絡(luò)設(shè)計,能夠提供流量可視和智能化分析,協(xié)助運維中心快速定位故障,排除異常模塊,將業(yè)務(wù)恢復(fù)時間縮短至分鐘級,在網(wǎng)絡(luò)處于擁塞的極端情況下,也可為運營商快速挽回?fù)p失。
5G時代運營商信令建網(wǎng)展望
隨著移動用戶的和數(shù)據(jù)業(yè)務(wù)的增長,特別是5G網(wǎng)絡(luò)的全面普及,網(wǎng)絡(luò)承載的信令流量將呈現(xiàn)指數(shù)增長。信令網(wǎng)是運營商通信網(wǎng)絡(luò)的神經(jīng)中樞,為應(yīng)對可能的流量激增,海內(nèi)外多家運營商已經(jīng)開始未雨綢繆,測試并引入SCP信令網(wǎng),把SCP作為簡化網(wǎng)絡(luò)、提高效率、保障安全的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,重點投入。
2021年,泰國A運營商率先引入SCP,作為5G網(wǎng)絡(luò)信令路由和管理網(wǎng)元。新的SCP網(wǎng)元使網(wǎng)絡(luò)信令路由大幅減少,免除運營商上萬個離散號段的路由配置和維護(hù)工作,網(wǎng)絡(luò)架構(gòu)的簡化不僅增強了網(wǎng)絡(luò)的健壯性,而且可以實現(xiàn)新業(yè)務(wù)的快速上線。
5G網(wǎng)絡(luò)賦能千行百業(yè)已經(jīng)初具規(guī)模,網(wǎng)絡(luò)承載的業(yè)務(wù)也將更加豐富。在網(wǎng)絡(luò)不斷演進(jìn)過程中,信令網(wǎng)也需同步進(jìn)行規(guī)劃和建設(shè),發(fā)揮信令網(wǎng)核心中樞的作用,保護(hù)網(wǎng)絡(luò)穩(wěn)定,提升維護(hù)效率,支撐5G網(wǎng)絡(luò)在社會生活中發(fā)揮更大價值。