最近,筆者參與了某大型煉化公司乙烯廠進行DCS分散控制系統升級改造項目。由于該工廠控制室過多而分散,企業希望建立全廠中心控制室,盡可能地降低操作員站和工程師站的數量。由于需要在中心控制室也設置1臺可以訪問多套裝置的總工程師站,對工業控制系統的安全提出了更高的要求。
經過前期的規劃和改造升級,該廠DCS由控制節點、操作節點和系統網絡構成。其中:控制節點包括過程控制站及過程控制網(SOnet)上與異構系統連接的通信接口等;操作節點包括工程師站、操作員站、組態服務器(主工程師站)、數據服務器等連接在過程信息網(SCnet)和過程控制網上的人機會話接口站點;系統網絡包括I/O總線、過程控制網、過程信息網、企業管理網等。
在中心控制室設置了1套冗余的OPC服務器,各裝置的生產管理系統實時數據庫的數據通過OPC服務器、安全數據采集網關送到生產信息管理系統。中心控制室設置的總工程師站可通過軟件訪問、切換實現與各裝置組態服務器的連接,從而實現對具體裝置的組態、監控。
但在規劃實施過程中仍然存在一些擔憂。由于DCS分散控制系統中的操作節點和控制節點以往均采用傳統服務器,在長期工業環境中運營容易出現硬盤、內存等硬件故障,從而導致系統停機,而且舊主機硬件生命周期結束后無法將系統整體遷移至新的硬件,網絡病毒導致多臺主機同時宕機、備份不及時導致主機整盤備份數據不完整等。
解決方案
針對DCS分散控制系統面臨的硬件風險問題,項目組決定為DCS系統進行容錯設計,提高DCS的可靠性和可用性,同時增強系統的安全防護能力。項目組嚴格按照企業提出的性能要求,即使系統中某臺計算機出現故障,也不會導致系統其它功能的喪失。經過廣泛的綜合評估,項目實施方最終選定了Stratus ftServer容錯服務器。
與傳統服務器相比,ftServer容錯服務器所采用的都是標準化硬件,使用的芯片組、DIMM和驅動器完全兼容其他業界標準x86系統,能非常方便的實現對傳統服務器系統的替代。
同時,ftServer容錯服務器獨創冗余硬件CRU架構,每個ftServer平臺都由兩個相同的客戶可更換單元(CRU)組成,每個單元都有自己的處理器、內存、存儲和電源。所有冗余組件和子系統作為一個整體打包為單個系統。
由于CRU支持熱插拔,無需關閉平臺或使用特殊工具。更換CRU后,系統會自動重新同步數據,當某一局部或某個計算機出現故障時,可以在不影響整個系統運行的情況下在線更換,迅速排除故障,極大地提高了DCS系統的可靠性和穩定性。
實施感悟
當前在工業系統升級改造過程中,很多企業仍然未能走出傳統的容災備份模式,認為必須構建雙機冗余備份或通過異地容災的方式才能擺脫數據丟失,解決系統安全問題。實際上,在Stratus將獨創的硬件冗余架構投入到行業實踐應用以來,越來越多的智能制造服務商或系統集成商開始與Stratus合作,將ftServer容錯服務器融入到自己的智能制造整體解決方案中,實現從故障恢復到故障預防的性能升級,讓方案變得更加穩定可靠。高效的備份還原系統固然能提升了工業控制系統維護業務的運作效率,但如果能讓工業系統實現“零宕機”,保障業務永遠在線,則更能增強企業的競爭力,使企業在快速變化的市場競爭力中立于不敗之地。隨著Stratus系列產品被廣泛地應用到石油石化、電力、食品、廢水處理等流程型工業,工業轉型升級過程必然會越來越多地出現Stratus產品的身影,為中國制造業升級保駕護航。
(來源:Stratus 容錯技術)