信望愛電腦系統的風險管理

【作者:tjm編輯案頭 2003.06.15


  沒有人可以保證電腦系統永遠正常運作,唯有「常備份」、「多備援」才能讓 資料的損失減到最低,才能由電腦系統的危機中復原過來。特別是在 SARS 疫情 嚴重的時候,誰也不知道技術人員何時不幸染病被隔離。所以電腦系統的風險管 理是很重要的課題。

  信望愛站為了讓電腦系統維持正常運作,從以前到現在逐步地形成一套風險 管理體系。好比早期的信望愛站因為技術人員無法常常接觸到機器,大都遠方遙 控機器,系統出問題時必須做到儘速由備份中復原資料,所以那時是採用硬碟配 合網路備份的方式來保護系統資料。

  當初的策略如下:「信望愛母站」架設外,還有「彼得分站」做備源。萬一 母站陣亡,還有分站起來。而兩台機器系統的硬碟中存放昨天與前天的備份資 料,每天四點鐘(透過系統的紀錄,我們知道每天晚上三點到早上七點系統使用 率最低)啟動備份程式(使用 Linux 內附的 GNU tar) 來壓縮備份系統資料, 並移除前天的資料。整個硬碟備份的工作大約在早上六點左右可以完成。而在工 作硬碟中的兩份備份資料則由三位技術同工在週一、週四,週二、週五,週三 、 週六的六點半,透過網路下載到自己電腦裡的備份硬碟中保存。整個網路備份, 大約在早上九點以前會完成。我們很長一段時間滿足於這樣的備份方法,也很有 效的解除幾次「誤殺」或系統損壞的危機。

  信望愛站遷出學術網路之後,信望愛站遷至高雄,從兩台機器變成三台機 器,WWW 主機、Life 主機和 Tech 主機。第三台 Tech 主機是供給技術人員測 試新技術用,並且也是當作前面兩台的備援機器。萬一前面兩台機器有一台壞掉, tech 就可以馬上取代。至於備份方式,我們改用磁帶備份,以取代早期的備份 硬碟與網路備份配套的備份策略。後來又因為磁帶機損壞,改採 DVD+RW 來備份。 詳細的備份策略說明如下:

  因為離開學術網路後技術同工可以常常直接接觸到機器,而且因為速度增 快的關係,有許多身在國外的網友也會進入信望愛站,因此不太適宜讓整個備 份的過程太長,以免影響國外網友的使用。並且也考慮保留比較長時間的備份 量,於是我們選用外接式 HP 的 DDS-2 DAT 機器(一卷磁帶可以備份 4-8GB) 來當備份設備,我們一共利用十一卷磁帶,做到三台機器三個月的備份量。因 為要一次備份三台機器的資料,所以還是得要透過網路備份的方式來完成整個 備份工作。

  至於備份軟體,經過了許多評估,起初我們是選擇了不要錢的 GNU tar 配 合 NFS 系統來作系統備份。不過 NFS 系統本身是相當容易被入侵的網路服 務,而且 Linux 系統有一段時間 NFS 常常出問題,因此後來就改用 tar 配合 rdist 的方式來進行網路備份,最後當我們對 OpenSSH 掌握比較好之後,我們就 用 openssh 來取代 rdist,以加強系統的安全性。

  每天凌晨開始,WWW 主機、Life 主機和 Tech 主機各自依序把檔案透過 tar 與 openssh 壓縮 存放至 tech 機器上的磁帶中,而每部機器備份的開始時間 必須控制在前一部機器備份結束之後。 這整個程序大約在六點半之前會結束, 這樣就完成了一天的備份工作。技術同工在每天早上八點以前就會換上新磁帶, 以備明天的備份工作。

  這十一卷磁帶,其中五卷各備份週二到週六凌晨的使用者資料。有三卷備份 每個月前三個禮拜 的使用者資料(在週日凌晨備份),有兩卷備份前兩個月的使 用者資料(在第四個禮拜的週日凌晨 備份)。最後一卷在每週一的凌晨用來備份 系統設定的資料。於是透過十一卷磁帶,我們就可以備份三個月的使用者資料與 一個禮拜前的系統設定資料(系統設定資料比較沒有歷史性的價值)。而每一卷 磁帶可以備份 100 次以上(亦即以目前一個禮拜使用一次,可以供兩年以上的 備份使用)。

  後來磁帶機損壞,重新購買的話價格高昂,於是我們改用 DVD+RW 配合 IDE 硬碟來備份。備份原理跟磁帶差不多,只是不直接放入備份媒體中,而先放入 一個 60G 的 IDE 硬碟,直到週日再燒錄出來。燒錄出來的 DVD+RW 片,則送到離主機 三、四公里遠的另一位同工家,以確保資料的安全。目前隨著系統資料量的增加 ,我們也在評估 USB 2.0 硬碟外接盒來當備份媒體的可行性。

  除了高雄原本的三台機器外,信望愛也在北部借用懷恩堂的一間房間,設立 分站機房(有兩台機器),北部也有一群技術組同工。萬一高雄水災,台北的機 器還可以正常運作。萬一台北地震,高雄的機器也可以正常運作。在北高兩地的 機房,其網路專線也是做到雙線路(各兩條雙向 512K ADSL)。萬一一邊線路不 通,另外一邊還可以通。

  如今因應 SARS,信望愛站亦重新將義工人力編組,萬一一個義工不幸染病 住院,還有下一個義工可以承接其事工。在這多重人力備源編制下,以確保信望 愛站在各種天災人禍都能正常運作。以上是信望愛資訊中心簡單的風險管理措施 分享,希望能對一些教會機構有所幫助。當然最終一切,還是要仰望上帝。只有 祂才是一切正常運作的最終保證。

信望愛負責人 tjm


上一則下一則