Re: [新聞] 幾分鐘可解決的故障 高鐵竟停擺4小時
※ 引述《rgx (teddybear)》之銘言:
: http://www.appledaily.com.tw/appledaily/article/headline/20130426/34978521/
: 【連線報導】有夠扯!台灣高鐵昨因台中站號誌電子聯鎖系統零件故障,全
: 線列車停擺4小時,旅客行程大受延誤,民眾痛罵「高鐵應變能力不及格」,
: 有立委被迫從高雄搭機到澎湖馬公、再轉飛台北開會;總計全台約3.5萬人受
: 影響。不過這起高鐵通車6年來、首次非天災引起的4小時大停擺,最後竟是
: 將系統關機後重新開機、只要幾分鐘就可解決,令人傻眼。行政院長江宜樺
: 撂重話:「如查明涉人為疏失,將進行懲處。」
一台電腦重新開機的時間要多久?恩,搭配SSD和輕巧的作業系統,
可能1分鐘之內(甚至在30秒以內)可以搞定。
但是一套完整的系統要重新啟動,就不是那麼簡單的事情了。
大家可以想見高鐵的軌道營運系統是由多個子系統來整合的,
每一個子系統控制或掌控不同的設備,每個子系統有多個伺服器和資料庫。
更重要的是,高鐵的子系統之中可能還具備不同的備援系統,
子系統和最後的整合控制單元會去選擇是不是由備援系統啟動運作,
因此就算主系統故障,備援系統應該還是有能力進行作業,
然而,主系統和備援系統的連接在這個時候就會成為關鍵,
如果備援系統沒有辦法完全地在第一時間連接其他的主系統,
讓備援系統與其他的子系統成為一體往前走,那最後才會選擇全系統重啟....
所以這絕對不是幾分鐘的問題,而是系統重啟範圍到底要多大?
我以台灣某一個還算是重要的控制系統為舉例,
系統上面只有主系統和主資料庫有異地備援的機制,
異地備援的中樞和主系統之間使用光纖連接、兩者相距大約10KM。
其他的子系統伺服器大約有40台,都串接在某一個網域裡面。
某一次主系統故障時,我們透過遙控方式啟動次系統,
從發現故障(主系統尚未關機,只是系統拼命出現錯誤訊息、無法正常運作),
到工程師嘗試使用手動方式排除故障,到最後決定使用備援系統,
中間就花掉超過1小時的時間....
高鐵的系統絕對比我們這一套控制系統來得更為複雜,
重啟系統不僅是最後的手段、也是最消極的手段。
因為你只是知道重啟可能可以解決問題,
但是重啟之後還要花多少時間系統會冒出相同問題呢?
更慘的情況是,重啟之後、但是尚未排除錯誤情形的系統其實是不定時炸彈,
你不知道系統甚麼時候會壞掉,只知道系統有可能壞掉、系統可能壞掉會很嚴重,
但是往往系統一重新啟動之後,又看似甚麼事都沒發生過.....
--
這也是為什麼程式工程師喜歡在伺服器上放乖乖,有時真的很不乖阿...XDDD
--
fabg's 航空‧鐵道‧交通生活部落格
http://fabg.pixnet.net/blog (fabg@運輸邦)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.12.137
推
04/26 13:46, , 1F
04/26 13:46, 1F
推
04/26 13:56, , 2F
04/26 13:56, 2F
→
04/26 13:56, , 3F
04/26 13:56, 3F
推
04/26 13:58, , 4F
04/26 13:58, 4F
推
04/26 13:59, , 5F
04/26 13:59, 5F
→
04/26 14:08, , 6F
04/26 14:08, 6F
推
04/26 14:20, , 7F
04/26 14:20, 7F
→
04/26 14:21, , 8F
04/26 14:21, 8F
→
04/26 14:30, , 9F
04/26 14:30, 9F
→
04/26 14:31, , 10F
04/26 14:31, 10F
→
04/26 14:32, , 11F
04/26 14:32, 11F
推
04/26 14:34, , 12F
04/26 14:34, 12F
推
04/26 14:35, , 13F
04/26 14:35, 13F
→
04/26 14:40, , 14F
04/26 14:40, 14F
→
04/26 14:41, , 15F
04/26 14:41, 15F
→
04/26 14:41, , 16F
04/26 14:41, 16F
推
04/26 14:44, , 17F
04/26 14:44, 17F
推
04/26 14:49, , 18F
04/26 14:49, 18F
→
04/26 15:27, , 19F
04/26 15:27, 19F
推
04/26 15:59, , 20F
04/26 15:59, 20F
→
04/26 16:00, , 21F
04/26 16:00, 21F
→
04/26 16:00, , 22F
04/26 16:00, 22F
→
04/26 16:01, , 23F
04/26 16:01, 23F
→
04/26 16:01, , 24F
04/26 16:01, 24F
推
04/26 16:52, , 25F
04/26 16:52, 25F
→
04/26 16:55, , 26F
04/26 16:55, 26F
→
04/26 16:57, , 27F
04/26 16:57, 27F
推
04/26 18:23, , 28F
04/26 18:23, 28F
→
04/26 18:23, , 29F
04/26 18:23, 29F
推
04/26 18:27, , 30F
04/26 18:27, 30F
→
04/26 18:27, , 31F
04/26 18:27, 31F
→
04/26 19:00, , 32F
04/26 19:00, 32F
→
04/26 19:04, , 33F
04/26 19:04, 33F
→
04/26 20:49, , 34F
04/26 20:49, 34F
推
04/26 21:10, , 35F
04/26 21:10, 35F
推
04/26 21:26, , 36F
04/26 21:26, 36F
→
04/26 21:27, , 37F
04/26 21:27, 37F
→
04/26 21:28, , 38F
04/26 21:28, 38F
推
04/26 21:43, , 39F
04/26 21:43, 39F
推
04/27 17:50, , 40F
04/27 17:50, 40F
推
04/28 08:26, , 41F
04/28 08:26, 41F
推
04/28 10:06, , 42F
04/28 10:06, 42F
推
04/29 00:49, , 43F
04/29 00:49, 43F
→
05/05 19:44, , 44F
05/05 19:44, 44F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):