軌道交通AFC線災(zāi)備設(shè)計(jì)方案

時(shí)間:2022-07-08 09:07:30

導(dǎo)語(yǔ):軌道交通AFC線災(zāi)備設(shè)計(jì)方案一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

摘要:本文基于鄭州市軌道交通自動(dòng)售檢票線網(wǎng)管理中心(ANCC)系統(tǒng)主副中心雙活設(shè)計(jì)方案,從災(zāi)備中心建設(shè)的必要性入手,分析得出選擇雙活中心方案建設(shè)。其次對(duì)雙活中心的容災(zāi)架構(gòu)、存儲(chǔ)雙活、應(yīng)用雙活和主備倒切流程等分別做出分析,展現(xiàn)了雙活中心的架構(gòu)特點(diǎn)和相較于傳統(tǒng)方案的應(yīng)用優(yōu)勢(shì),為后續(xù)城市線網(wǎng)管理中心的建設(shè)提供參考。

關(guān)鍵詞:城市軌道交通;自動(dòng)售檢票系統(tǒng);災(zāi)備

1引言

近年,全國(guó)各地城市軌道交通的快速建設(shè),各大城市的城軌線網(wǎng)逐漸成型,對(duì)線網(wǎng)級(jí)自動(dòng)化、智能化調(diào)度指揮和運(yùn)維管理的需求日益加強(qiáng)[1]。鄭州市軌道交通在建設(shè)多線路中心(MLC)和清分中心(ACC)擴(kuò)容的背景下,從架構(gòu)、可行性、建設(shè)成本、技術(shù)發(fā)展趨勢(shì)等方面進(jìn)行了充分的論證和分析,依托云平臺(tái)、大數(shù)據(jù)的快速發(fā)展,最終確定實(shí)施ACC及MLC系統(tǒng)組合建設(shè)方案,即建設(shè)鄭州市軌道交通線網(wǎng)管理中心ANCC系統(tǒng)。可以看出,ANCC成為了鄭州市軌道交通全線網(wǎng)afc系統(tǒng)協(xié)調(diào)及對(duì)外票務(wù)信息服務(wù)和管理的主要窗口,重要性可見(jiàn)一斑。ANCC系統(tǒng)癱瘓或者由于其它原因(火災(zāi)、恐怖襲擊等)退出運(yùn)行,將會(huì)導(dǎo)致全線網(wǎng)運(yùn)營(yíng)管理處于癱瘓狀態(tài),造成票務(wù)收益損失[2],因此建立一套安全、可靠的災(zāi)備系統(tǒng),是非常必要的[3]。本文基于鄭州市軌道交通ANCC系統(tǒng)的建設(shè),分析了災(zāi)備中心建設(shè)的必要性、雙活中心方案的設(shè)計(jì)選擇,并對(duì)雙活中心的建設(shè)方案進(jìn)行介紹。

2建設(shè)背景

2.1必要性分析

災(zāi)備方案是ANCC建設(shè)工作重要內(nèi)容,關(guān)系到業(yè)務(wù)可用性、業(yè)務(wù)連續(xù)性、數(shù)據(jù)安全性、系統(tǒng)合規(guī)性等多方面[4]。高可用設(shè)計(jì)包括平臺(tái)架構(gòu)高可用和業(yè)務(wù)系統(tǒng)高可用,保證整個(gè)業(yè)務(wù)平臺(tái)可以穩(wěn)定運(yùn)行,當(dāng)故障出現(xiàn)時(shí)快速定位并恢復(fù)故障[5];對(duì)于業(yè)務(wù)系統(tǒng)來(lái)說(shuō),在出現(xiàn)意外宕機(jī)時(shí)業(yè)務(wù)不會(huì)中斷,對(duì)用戶(hù)無(wú)感知。ANCC作為線網(wǎng)級(jí)生產(chǎn)平臺(tái),作為各線路的大腦,如果由于意外事故的出現(xiàn),線網(wǎng)級(jí)業(yè)務(wù)癱瘓并停止運(yùn)行,會(huì)給整個(gè)行業(yè)帶來(lái)嚴(yán)重的后果[6]。所以應(yīng)該建立擁有線網(wǎng)業(yè)務(wù)功能的后備中心系統(tǒng),當(dāng)主系統(tǒng)發(fā)生故障或意外不能正常工作時(shí),及時(shí)、快速地接管主系統(tǒng)的基本工作,實(shí)現(xiàn)正常情況下異地災(zāi)備、緊急情況下應(yīng)急處理等。

2.2雙活中心的選擇

災(zāi)備包含三個(gè)層次,即基礎(chǔ)設(shè)施災(zāi)備、數(shù)據(jù)災(zāi)備和應(yīng)用災(zāi)備[7]。基礎(chǔ)設(shè)施災(zāi)備是對(duì)業(yè)務(wù)處理邏輯相關(guān)的設(shè)備備份,數(shù)據(jù)災(zāi)備是對(duì)數(shù)據(jù)備份以保證數(shù)據(jù)的完整性,應(yīng)用災(zāi)備是對(duì)應(yīng)用處理系統(tǒng)的冗余備份。雙活中心方案從基礎(chǔ)設(shè)施、數(shù)據(jù)、應(yīng)用三個(gè)層面進(jìn)行容災(zāi),具有更高級(jí)的連續(xù)性和高可用性,能夠針對(duì)服務(wù)器、硬盤(pán)、適配器卡、網(wǎng)絡(luò)等物理設(shè)備實(shí)施保護(hù),也能針對(duì)操作系統(tǒng)、數(shù)據(jù)庫(kù)、應(yīng)用、服務(wù)等軟件的致命錯(cuò)誤實(shí)施保護(hù),對(duì)于發(fā)生在本地的錯(cuò)誤,具備自動(dòng)接管功能[8]。該方案技術(shù)實(shí)現(xiàn)復(fù)雜度最高,但能夠充分利用兩個(gè)中心的所有資源,業(yè)務(wù)高可用性和連續(xù)性最優(yōu)。

3ANCC系統(tǒng)雙活中心關(guān)鍵技術(shù)

3.1雙活容災(zāi)架構(gòu)

各線路數(shù)據(jù)匯聚節(jié)點(diǎn)就近接入,主副中心同時(shí)處理業(yè)務(wù),資源得到有效利用;業(yè)務(wù)處理完成后,寫(xiě)入主中心數(shù)據(jù)庫(kù),主副中心數(shù)據(jù)庫(kù)通過(guò)數(shù)據(jù)庫(kù)同步軟件進(jìn)行同步;當(dāng)主中心/副中心接入故障或業(yè)務(wù)處理故障時(shí),系統(tǒng)通過(guò)預(yù)置的備用路由,自動(dòng)完成線路接入的切換;當(dāng)系統(tǒng)數(shù)據(jù)存儲(chǔ)出現(xiàn)故障時(shí),系統(tǒng)通過(guò)內(nèi)部業(yè)務(wù)倒切,實(shí)現(xiàn)數(shù)據(jù)的有序入庫(kù)存儲(chǔ);通過(guò)系統(tǒng)應(yīng)用雙活設(shè)計(jì),實(shí)現(xiàn)系統(tǒng)的高穩(wěn)定運(yùn)營(yíng)。生產(chǎn)中心發(fā)生災(zāi)難(生產(chǎn)中心停電、火災(zāi)等):可對(duì)受云服務(wù)器高可用性(CSHA)服務(wù)保護(hù)的生產(chǎn)云服務(wù)器自動(dòng)或手工切換到災(zāi)備中心,快速啟動(dòng)容災(zāi)云服務(wù)器。計(jì)劃內(nèi)停機(jī)(計(jì)劃性停電、日常運(yùn)維等):容災(zāi)管理員可對(duì)受CSHA服務(wù)保護(hù)的生產(chǎn)云服務(wù)器進(jìn)行一鍵式的計(jì)劃性遷移,在災(zāi)備中心快速啟動(dòng)容災(zāi)云服務(wù)器,保證業(yè)務(wù)數(shù)據(jù)零丟失;在原生產(chǎn)中心完成計(jì)劃性活動(dòng)后,容災(zāi)管理員對(duì)受保護(hù)云服務(wù)器進(jìn)行反向重保護(hù),并在合適時(shí)間通過(guò)計(jì)劃性遷移將業(yè)務(wù)切回到原生產(chǎn)中心。雙活中心的總體架構(gòu)如圖1所示。

3.2存儲(chǔ)雙活方案

3.2.1方案描述云硬盤(pán)高可用服務(wù)(VHA)為云服務(wù)器中的云硬盤(pán)提供本地存儲(chǔ)雙活保護(hù)[9]。當(dāng)單套存儲(chǔ)設(shè)備發(fā)生故障時(shí),數(shù)據(jù)零丟失,業(yè)務(wù)不中斷。該方案是基于FusionSphere OpenStack云操作系統(tǒng)平臺(tái)的IaaS層云服務(wù)器容災(zāi)方案。它通過(guò)云數(shù)據(jù)中心結(jié)合存儲(chǔ)雙活實(shí)現(xiàn)單中心內(nèi)的云硬盤(pán)容災(zāi)。3.2.2方案架構(gòu)云硬盤(pán)高可用服務(wù)與網(wǎng)絡(luò)是解耦的,原則上使用FusionCloud的通用網(wǎng)絡(luò)方案即可,僅要求在通用組網(wǎng)方案上預(yù)留存儲(chǔ)網(wǎng)絡(luò)端口,增加兩套雙活存儲(chǔ)間的雙活數(shù)據(jù)路徑。在組件部署上,云硬盤(pán)高可用主要增加了存儲(chǔ)仲裁軟件和BCManager eReplication兩大組件。二者均可部署在物理機(jī)中,也可以部署在虛擬機(jī)中。如圖2所示。3.2.3實(shí)現(xiàn)原理租戶(hù)登錄VHA服務(wù)申請(qǐng)界面,為云主機(jī)申請(qǐng)本地存儲(chǔ)雙活容災(zāi)保護(hù)。系統(tǒng)過(guò)濾出該租戶(hù)具備創(chuàng)建容災(zāi)保護(hù)條件但還尚未創(chuàng)建的云主機(jī)[10]。租戶(hù)可從中選擇單個(gè)或多個(gè)需要容災(zāi)保護(hù)的云主機(jī),提交申請(qǐng)。后臺(tái)自動(dòng)調(diào)用容災(zāi)管理組件對(duì)應(yīng)API,創(chuàng)建存儲(chǔ)雙活保護(hù),實(shí)現(xiàn)的基本原理及主要步驟如下:(1)調(diào)用Cinder建卷API,在對(duì)應(yīng)的容災(zāi)存儲(chǔ)上創(chuàng)建雙活占位卷(并設(shè)置為預(yù)留狀態(tài))及雙活LUN;(2)調(diào)用DRextend容災(zāi)擴(kuò)展組件,為雙活LUN配置雙活Pair;(3)調(diào)用DRextend容災(zāi)擴(kuò)展組件,創(chuàng)建雙活一致性組(將雙活Pair加入雙活一致性組,當(dāng)災(zāi)難發(fā)生時(shí),可實(shí)現(xiàn)存儲(chǔ)一致性切換,實(shí)現(xiàn)存儲(chǔ)一致性保護(hù));(4)調(diào)用Nova的在線重連雙活卷擴(kuò)展接口,將創(chuàng)建的雙活LUN掛載給云主機(jī);(5)生成VHA保護(hù)服務(wù)實(shí)例。3.2.4方案優(yōu)勢(shì)(1)開(kāi)放架構(gòu)業(yè)界率先推出基于Openstack+KVM云架構(gòu)的云硬盤(pán)高可用方案,在一套Openstack私有云架構(gòu)上構(gòu)建云服務(wù)器本地存儲(chǔ)雙活保護(hù)能力防止廠商鎖定,為客戶(hù)節(jié)約成本擴(kuò)展Openstack標(biāo)準(zhǔn)并開(kāi)放接口,只要第三方廠家支持該接口,就可以接入進(jìn)行統(tǒng)一高可用配置和管理。(2)按需使用支持租戶(hù)按需自助申請(qǐng)?jiān)朴脖P(pán)高可用服務(wù),服務(wù)開(kāi)通便捷高效,業(yè)務(wù)發(fā)放周期由一周縮短到半小時(shí)內(nèi),系統(tǒng)根據(jù)租戶(hù)要求自動(dòng)化配置和開(kāi)通云硬盤(pán)高可用服務(wù)。(3)可靠高效基于存儲(chǔ)側(cè)的雙活技術(shù),對(duì)主機(jī)性能無(wú)影響;數(shù)據(jù)實(shí)時(shí)同步。

3.3應(yīng)用雙活方案

3.3.1方案描述此方案特點(diǎn)是各線路就近接入主、副中心,主副中心同時(shí)處理業(yè)務(wù),有效利用資源;針對(duì)主副中心不能同時(shí)上線的情況,由單中心改為雙中心的實(shí)施過(guò)程較簡(jiǎn)單,可在線操作,不影響業(yè)務(wù)運(yùn)行,實(shí)施風(fēng)險(xiǎn)較小??傮w架構(gòu)如圖3所示。3.3.2實(shí)現(xiàn)原理云服務(wù)器高可用(CSHA)是為了當(dāng)生產(chǎn)中心故障后,容災(zāi)云服務(wù)器能夠掛載容災(zāi)端的卷,并在災(zāi)備中心快速啟動(dòng),實(shí)現(xiàn)的基本原理如下:租戶(hù)根據(jù)生產(chǎn)中心網(wǎng)絡(luò)、計(jì)算的資源類(lèi)型及高可用要求,在災(zāi)備中心配置相同或相似的網(wǎng)絡(luò)、計(jì)算資源,并申請(qǐng)CSHA服務(wù)實(shí)例。服務(wù)申請(qǐng)成功后,根據(jù)生產(chǎn)端云服務(wù)器的云磁盤(pán)信息,自動(dòng)在容災(zāi)端創(chuàng)建相同規(guī)格的云磁盤(pán),并在存儲(chǔ)層配置雙活復(fù)制對(duì)、一致性組,實(shí)現(xiàn)數(shù)據(jù)的鏡像保護(hù)。當(dāng)生產(chǎn)中心發(fā)生站點(diǎn)級(jí)故障時(shí),云平臺(tái)仲裁服務(wù)顯示站點(diǎn)故障,同時(shí)生產(chǎn)云服務(wù)器、存儲(chǔ)層雙活復(fù)制對(duì)故障。此時(shí),可自動(dòng)或管理員手工觸發(fā)CSHA保護(hù)組切換,將災(zāi)備中心的云硬盤(pán)掛載至容災(zāi)云服務(wù)器并啟動(dòng)云服務(wù)器。容災(zāi)云服務(wù)器接入所在災(zāi)備中心的網(wǎng)絡(luò),取決于容災(zāi)云服務(wù)器創(chuàng)建時(shí)所接入的VPC網(wǎng)絡(luò)。

3.4主備倒切流程

主備系統(tǒng)倒切應(yīng)急處置流程分為五個(gè)階段,即災(zāi)難發(fā)生、處置決策、前期準(zhǔn)備、應(yīng)急處置和處置結(jié)束。災(zāi)難發(fā)生階段,當(dāng)系統(tǒng)發(fā)生災(zāi)難影響生產(chǎn)中心正常業(yè)務(wù)時(shí),應(yīng)立即將災(zāi)難情況報(bào)告給應(yīng)急處置小組組長(zhǎng)、副組長(zhǎng)。處置決策階段,應(yīng)急處置小組組長(zhǎng)、副組長(zhǎng),收到災(zāi)難情況報(bào)告后,應(yīng)立即組織小組成員開(kāi)會(huì),分析災(zāi)難具體情況、判斷影響范圍并確定對(duì)應(yīng)措施啟動(dòng)相關(guān)預(yù)案,開(kāi)展應(yīng)急處置工作。前期準(zhǔn)備階段,根據(jù)應(yīng)急處置小組組長(zhǎng)決策,各分組組長(zhǎng)按照預(yù)案內(nèi)容,組織分組成員進(jìn)行主備系統(tǒng)倒切前的相關(guān)技術(shù)準(zhǔn)備。副組長(zhǎng)負(fù)責(zé)與相關(guān)單位溝通,協(xié)調(diào)主備系統(tǒng)倒切前工作。應(yīng)急處置階段,準(zhǔn)備工作完成后,應(yīng)急處置小組組長(zhǎng)指揮小組成員進(jìn)行主備系統(tǒng)倒切工作。系統(tǒng)倒切完成后,各分組組長(zhǎng)負(fù)責(zé)確認(rèn)系統(tǒng)狀態(tài)、業(yè)務(wù)情況,并向組進(jìn)行報(bào)告。處置結(jié)束階段,主備系統(tǒng)倒切完成后,確認(rèn)系統(tǒng)狀態(tài)、業(yè)務(wù)情況正常后,應(yīng)急處置小組組長(zhǎng)向上級(jí)單位、領(lǐng)導(dǎo)匯報(bào)應(yīng)急處置工作情況。

4結(jié)論

軌道交通自動(dòng)售檢票系統(tǒng)線網(wǎng)管理中心的建設(shè),提高了基礎(chǔ)設(shè)施資源的利用率,實(shí)現(xiàn)了鄭州軌道信息化基礎(chǔ)設(shè)施資源的統(tǒng)一規(guī)劃、統(tǒng)一建設(shè)、按需調(diào)配、即需即用、有效共享。采用雙活中心的容災(zāi)方案,可更大程度保證業(yè)務(wù)的連續(xù)性,也可有效保障災(zāi)難發(fā)生后,業(yè)務(wù)恢復(fù)的時(shí)效性。隨著技術(shù)的發(fā)展和建設(shè)需求,后續(xù)可繼續(xù)探索災(zāi)備中心建設(shè)的可能性。

作者:徐淑鵬 陳俊亞 曹美閣 單位:鄭州地鐵集團(tuán)有限公司