2010/04/05
經濟部能源局
點閱人次:
838
字型:
▓撰文:湯政仁
透過國際ICT(Information and Communication Technology)節能應用領域發展趨勢與研析,國際ICT節能案例依據不同ICT節能驅動力可分為3大構面:第一構面為基礎設施創新,政府投入扮演關鍵角色,包括:智慧建築、智慧電網、智慧都市、智慧交通與整合型再生能源等5項領域;第二構面屬於行為模式改變,必須仰賴教育宣導,包括:智慧工作與虛擬化IT服務兩項領域;第三構面為利用ICT技術提升能源效率,屬於市場與技術發展導向,包括:ICT節能設備、智慧車輛與智慧環境監控等3項領域,其中虛擬化IT服務同時也是「雲端運算」的重點發展項目。本文就兩者的關係,以ICT的節能技術觀點來看雲端運算,並提出可能發展方向與各方先進共同探討。
雲端運算並不是一項新興技術,而是一種分散式運算的形式,其在服務端利用多台電腦同時進行運算,而雲端服務的提供者:諸如Google、Yahoo和Amazon等大型網路公司,使用數以萬計的伺服器,構成叢集而成為一個龐大的運算資源,讓使用者得以透過網路來存取資料或進行運算。
虛擬化技術為雲端重點
雲端運算業者不講究伺服器效能表現,對雲端運算業者而言,伺服器不過是一般的IT商品,對伺服器的主要要求不在於速度和效能,而是擴充彈性及低成本,因此允許快速提供模擬平台的虛擬化技術成為雲端運算的重要環節。虛擬機器是將一個實體硬體模擬出來多個虛擬機器,讓一台機器可以安裝好幾個作業系統,而每一個作業系統還以為是在一台專屬的硬體上執行,每個虛擬伺服器都是獨立環境。虛擬化技術在下述幾點可以有效協助雲端運算:
一、達成規模經濟
虛擬化可以使企業利用相同數量的伺服器提供更多種類的運算服務;當然,換句話說,也就是可以使用更少的伺服器維持相同的運算服務類型。
二、運算平台與應用服務可以彼此獨立
許多應用服務軟體被設計成只能在特定硬體平台上執行。因此,當需要某一軟體服務時,必須連著運作硬體平台一同購買或租用,即便是該必要服務僅在少數的時間需要運行;造成的結果是:該硬體平台絕大部分的時間除了增加用電量外,無所事事。虛擬化技術使兩者可以互相獨立。
三、部署速度以及彈性
採購伺服器並加以部署、安裝、設定,到服務被啟動並平穩執行,平均需要花費4到6週。但是,虛擬機器大約快30倍。當然,操作過程和管理工具需要更改以配合這種處理速度。但是,加速此類作業流程是企業的共同期待。
伺服器節能技術
在網路資料流量與儲存量不斷攀高、資訊電子化等潮流趨勢下,電腦伺服器機房的能源消耗在節能減碳的議題中不斷被重覆提及,能源及冷卻問題更是電腦伺服器機房近年備受關注的課題。
就企業而言,雖然目前大多思維仍放在資訊技術與單一設備是否達到節能標準,但從需求面著手進行評估與設計,包括:電力、空調、冷卻系統等環節,方為成功導入節能電腦伺服器機房之關鍵因素。電腦伺服器機房的耗電問題是近來美國政府關切的耗能問題。
目前美國的伺服器以及電腦機房的能源消耗相當明顯,在2006年這個部門的電力消耗高達610億瓩╱小時(kWh),電費高達45億美元,占當年全美耗電量1.5%,耗電量大於全美彩色電視的耗電量,或者等於全國580萬戶家庭用電。單單是美國政府的伺服器以及電腦機房在2006年就占了這個項目10%,也就是61億瓩╱小時(kWh)。
從「電腦伺服器機房耗電」圖可以得知,電腦伺服器占了機房耗電的51%,目前的雲端伺服器機房大多使用叢集伺服器系統提供服務,網路服務叢集是需要實現能在Five-nines(即99.999%)甚至更高比率的業務時間內可靠執行的系統,此可用比率意味著1天內系統故障的時間將不可多於1秒。這種叢集系統稱為高可用性系統,該系統的設計透過對冗餘(Redundant)的硬體和軟體進行組合,無需人為干預即可管理故障檢測和錯誤更正。
對於建置叢集系統的雲端伺服器機房,溫度的變化是機器運轉發熱後所造成的現象;其原因在於叢集內正在運轉機器的電源效率、機器的運轉狀況、機器的工作情形等。而目前決定上述各發熱因素的方式,則是由機房人員根據業務需求、客戶連線需求情況等利用經驗法則予以控制。舉例來說:一個具有20萬客戶的域名服務業者,其叢集伺服器內每計算單元(在叢集伺服器內每個計算單元多為一個獨立的商用伺服器或電腦)可以服務1千名客戶的需求,為了保證客戶需求均能滿足,很可能需要同時啟動200部計算單元進入「服務」狀態,而依據該計算單元的平均持續工作時間(MTTF)以及平均修復時間(MTTR),額外20台的備援計算單元也會啟動在「待機」狀態。
上述的控制是一個標準的利用冗餘架構達成高可用性服務的運轉情境。假設每計算單元的用電容量為350W,則此機房計算單元用電量為每小時77度,以空調用電量占總用電量三分之一計算,該機房每小時耗電約115度,每日的耗電為2,760度,每月則為82,800度。使用節能伺服器對於此問題的解決並不具經濟效益,因為節能伺服器的單價高昂,超越了電費降低所能帶來的效益,對於商業運轉客戶並不具任何誘因。由於雲端運算服務業必須保證其客戶需求任何時刻均能滿足,因此經驗上會以服務所需的最大需求容量做為基本的運轉數量。然而,網路上的需求並不是隨時都在滿載的情況;以域名服務來說,每日會進行變更的機會是不可能出現的。實際的運轉需求可能是最大需求量的十分之一、甚至更低;換句話說,即便是使用了虛擬化技術,服務業者的用電費用仍有超過90%是無端損耗的。
雲端運算伺服器需量預測
解決上述雲端運算伺服器耗電浪費問題的方法在於「需量預測」,由需量預測可以將需要的運轉元件數量進行排程。決定叢集系統的合適運轉元件數量的關鍵在於網路需求。圖3為北區區網的流量統計圖,圖中顯示訊息量在不同時段有極大的差異。
網路需求的尖峰時間與用電負載尖峰時間非常接近,但是網路流量的變化曲線遠較電力負載為大。需要注意的是:由於工作日的工時固定,因此可以顯示與電力需求曲線類似的效果。若是選擇特定學校或是網路服務公司的流量統計,尖峰時刻位置經常會有極大的差異。對於提供網路服務的業者而言,客戶的來源群體以及他們進行網路活動的時間是網路需求負載影響因素。關於叢集元件運轉需量預測演算法包括了動態規劃法、窮舉法、基因演算法、類神經網路演算法、重複樣式搜尋演算法等,當中窮舉法雖然可以得到較佳的解決,然而,其運算複雜度在具有大量設備或考慮因素的環境中,卻會變得不切實際。其餘各種方法,若是加入網路流量趨勢之因素,以往需量預測演算法適用性有待進一步的探討。
無論如何,若是網路服務提供者能對網路需求樣式加入考慮進行需量預測而得到最佳容量,並在網路需求尖峰以及需求離峰根據可被客戶接受的服務品質做適當的機器啟動或停止之調整,則電費的負擔將有可觀降低;而對於因為以最大網路需求量為基礎,而啟動具備大量冗餘備援機組的叢集,衍生出過量運轉需求所造成的能源浪費情況也會有極大改善。
要達到合理的需量預測必須考慮伺服器耗電量與網路服務需量的關係。首先,當伺服器的運算量高,耗電量也將隨之上升,其次,網路需量越高亦將會造成CPU使用率的提升。
承上,機房的管理者可以根據網路需量與服務品質做調整,決定每台伺服器所需啟動的虛擬化節點數量,並發展對於高可用性雲端運算叢集伺服器網路服務需量的預測演算法,配合服務品質、即時網路需求、重啟成功率、版本同步延遲以取得叢集中所需運轉、關閉或待機的節點數量,並由運轉數量之變化推導出高可用性叢集模組電力需量預測,並可由此構建雲端運算叢集伺服器能源控制的整合管理模式。
展望及結語
由於網際網路上資料流量的多寡與雲端運算伺服器機房的能源消耗有密切關係,所以必須進行網際網路上資料流量之週期性分析。網路流量呈現週期性是由於使用者的行為與習慣所造成。經由得知網路服務需求量後,進行機房設備管理,因此,預測未來一個時間週期的網路服務需求量是雲端運算伺服器機房的管理重點。
國內產業大多注重在設備製造,但在雲端運算的需求中,運算服務業者可以利用虛擬化技術降低伺服器效能表現。對雲端運算業者而言,伺服器不過是一般的IT商品,對伺服器的主要要求不在於速度和效能,而是擴充彈性及低成本。因此,此產業很可能面臨其他國家或地區以較低的製造成本,奪取國內製造業者所殷殷期待的雲端商機。唯有提高產品的附加功能,才可避免進入低價競銷的惡性循環,而配合節能減碳的世界風潮,使雲端設備可以協助雲端運算業者降低用電需求,將如本文所述的ICT節能技術導入相關產品,或許不失為一條可行之路。(作者為大同大學電機系助理教授)