Re: [新聞] 幾分鐘可解決的故障 高鐵竟停擺4小時

看板Railway作者 (藍天.翱翔)時間12年前 (2013/04/26 13:28), 編輯推噓20(20024)
留言44則, 26人參與, 最新討論串2/2 (看更多)
※ 引述《rgx (teddybear)》之銘言: : http://www.appledaily.com.tw/appledaily/article/headline/20130426/34978521/ : 【連線報導】有夠扯!台灣高鐵昨因台中站號誌電子聯鎖系統零件故障,全 : 線列車停擺4小時,旅客行程大受延誤,民眾痛罵「高鐵應變能力不及格」, : 有立委被迫從高雄搭機到澎湖馬公、再轉飛台北開會;總計全台約3.5萬人受 : 影響。不過這起高鐵通車6年來、首次非天災引起的4小時大停擺,最後竟是 : 將系統關機後重新開機、只要幾分鐘就可解決,令人傻眼。行政院長江宜樺 : 撂重話:「如查明涉人為疏失,將進行懲處。」 一台電腦重新開機的時間要多久?恩,搭配SSD和輕巧的作業系統, 可能1分鐘之內(甚至在30秒以內)可以搞定。 但是一套完整的系統要重新啟動,就不是那麼簡單的事情了。 大家可以想見高鐵的軌道營運系統是由多個子系統來整合的, 每一個子系統控制或掌控不同的設備,每個子系統有多個伺服器和資料庫。 更重要的是,高鐵的子系統之中可能還具備不同的備援系統, 子系統和最後的整合控制單元會去選擇是不是由備援系統啟動運作, 因此就算主系統故障,備援系統應該還是有能力進行作業, 然而,主系統和備援系統的連接在這個時候就會成為關鍵, 如果備援系統沒有辦法完全地在第一時間連接其他的主系統, 讓備援系統與其他的子系統成為一體往前走,那最後才會選擇全系統重啟.... 所以這絕對不是幾分鐘的問題,而是系統重啟範圍到底要多大? 我以台灣某一個還算是重要的控制系統為舉例, 系統上面只有主系統和主資料庫有異地備援的機制, 異地備援的中樞和主系統之間使用光纖連接、兩者相距大約10KM。 其他的子系統伺服器大約有40台,都串接在某一個網域裡面。 某一次主系統故障時,我們透過遙控方式啟動次系統, 從發現故障(主系統尚未關機,只是系統拼命出現錯誤訊息、無法正常運作), 到工程師嘗試使用手動方式排除故障,到最後決定使用備援系統, 中間就花掉超過1小時的時間.... 高鐵的系統絕對比我們這一套控制系統來得更為複雜, 重啟系統不僅是最後的手段、也是最消極的手段。 因為你只是知道重啟可能可以解決問題, 但是重啟之後還要花多少時間系統會冒出相同問題呢? 更慘的情況是,重啟之後、但是尚未排除錯誤情形的系統其實是不定時炸彈, 你不知道系統甚麼時候會壞掉,只知道系統有可能壞掉、系統可能壞掉會很嚴重, 但是往往系統一重新啟動之後,又看似甚麼事都沒發生過..... -- 這也是為什麼程式工程師喜歡在伺服器上放乖乖,有時真的很不乖阿...XDDD -- fabg's 航空鐵道交通生活部落格 http://fabg.pixnet.net/blog (fabg@運輸邦) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.12.137

04/26 13:46, , 1F
推一下 大型系統的整個架構真的不是那麼好處理
04/26 13:46, 1F

04/26 13:56, , 2F
就跟飛機上面AVIONICS一樣,你不知道它是不是假訊號
04/26 13:56, 2F

04/26 13:56, , 3F
但是遇到問題不處理又不行...
04/26 13:56, 3F

04/26 13:58, , 4F
推在伺服器上放乖乖
04/26 13:58, 4F

04/26 13:59, , 5F
我猜這次工程師應該是買到草莓口味(紅色)的乖乖了...
04/26 13:59, 5F

04/26 14:08, , 6F
記得要放椰子的,而且不能過期 XD
04/26 14:08, 6F

04/26 14:20, , 7F
不是放五香的?
04/26 14:20, 7F

04/26 14:21, , 8F
喔好吧我記錯了XD
04/26 14:21, 8F

04/26 14:30, , 9F
話說新聞有說到過了九點後決定重新開機
04/26 14:30, 9F

04/26 14:31, , 10F
十點半發出第一班車,推測重開機大概要1~1.5小時?
04/26 14:31, 10F

04/26 14:32, , 11F
雖然新聞寫的是幾分鐘後就好了XD
04/26 14:32, 11F

04/26 14:34, , 12F
重啟真的是下下策 誰知重啟之後一定正常?
04/26 14:34, 12F

04/26 14:35, , 13F
但是最沒有辦法的辦法就是重開機
04/26 14:35, 13F

04/26 14:40, , 14F
所以說就是最沒有辦法啊
04/26 14:40, 14F

04/26 14:41, , 15F
比較怕的其實是要跟列車溝通的系統要重新啟動...
04/26 14:41, 15F

04/26 14:41, , 16F
那個東西牽涉很多通訊因素,有時要等超久的....
04/26 14:41, 16F

04/26 14:44, , 17F
我曾經把PC重啟之後,VGA就陣亡了...
04/26 14:44, 17F

04/26 14:49, , 18F
快投報紙吧XD 救多少人算多少人
04/26 14:49, 18F

04/26 15:27, , 19F
最好的辦法是讓他淡化,投報紙只是更延伸議題而已...
04/26 15:27, 19F

04/26 15:59, , 20F
推最後一句
04/26 15:59, 20F

04/26 16:00, , 21F
很多大型系統有些資源是相依的
04/26 16:00, 21F

04/26 16:00, , 22F
不是全部同時重開就好
04/26 16:00, 22F

04/26 16:01, , 23F
此外強制重開機可能有資料不一致問題又要重建
04/26 16:01, 23F

04/26 16:01, , 24F
說的簡單 一堆人電腦當機就死在那了啊
04/26 16:01, 24F

04/26 16:52, , 25F
所以 高鐵這麼做是錯誤的選擇嗎?
04/26 16:52, 25F

04/26 16:55, , 26F
應該說是不得不的下下策的最終唯一選擇吧
04/26 16:55, 26F

04/26 16:57, , 27F
就營運結果論來說是正確的 就維修結果論來說就難說了
04/26 16:57, 27F

04/26 18:23, , 28F
多故障幾次 台灣人民也會說是陳水扁害的
04/26 18:23, 28F

04/26 18:23, , 29F
誰叫他要蓋高鐵 不蓋就不會這樣
04/26 18:23, 29F

04/26 18:27, , 30F
基本上重開機甚麼事情都解決不了,你永遠不知道你多快會遇到
04/26 18:27, 30F

04/26 18:27, , 31F
同樣的問題;除非打從一開始就不想管了...
04/26 18:27, 31F

04/26 19:00, , 32F
鬧萬系列連這種文也要來亂是甚麼心態?
04/26 19:00, 32F

04/26 19:04, , 33F
無視無視
04/26 19:04, 33F

04/26 20:49, , 34F
xxxx好吵
04/26 20:49, 34F

04/26 21:10, , 35F
xxxx好吵
04/26 21:10, 35F

04/26 21:26, , 36F
照新聞的說法,「直到9時許,維修人員決定關機後重新開機,
04/26 21:26, 36F

04/26 21:27, , 37F
幾分鐘後系統即恢復正常。巡軌後上午10時30分恢復全線雙線運
04/26 21:27, 37F

04/26 21:28, , 38F
轉。」重置時間似乎沒有想像中那麼久?
04/26 21:28, 38F

04/26 21:43, , 39F
大家有看過侏儸紀公園第1集吧,大型系統重啟應該會那麼複雜
04/26 21:43, 39F

04/27 17:50, , 40F
而且要放椰子口味的 放五香的會被學長敲頭....
04/27 17:50, 40F

04/28 08:26, , 41F
結果推文重點都是乖乖 XD
04/28 08:26, 41F

04/28 10:06, , 42F
有時候,重開以後開不起來更慘 XD
04/28 10:06, 42F

04/29 00:49, , 43F
放到快過期的也會被念...
04/29 00:49, 43F

05/05 19:44, , 44F
那最後還是重啟系統就解決了,那麼現在的高鐵不安全囉
05/05 19:44, 44F
文章代碼(AID): #1HUX25ZH (Railway)
文章代碼(AID): #1HUX25ZH (Railway)