加強數據中心運營的4種方式
在當今互聯的社會中,數據中心需要不斷突破機器學習的界限,以避免在競爭中落后或不堪重負。以下是機器學習可用于加強數據中心運營的4種方式:
(1)最大限度地提高能源效率
全球數據中心的能耗占到全球能源使用量的1%。這聽起來可能是一個很小的數字,但即使是運營效率的適度提高,也會節約顯著的成本,并阻止數以百萬噸計的二氧化碳排放到大氣中。好消息是能源管理是最容易實施機器學習的領域之一。例如,谷歌公司使用DeepMind節省了約30%的能源,顯著減少了管理費用。
(2)準確的容量規劃
為了滿足日益增長的工作量,數據中心管理人員必須提前準確預測對計算資源的需求。這些預測需要實時更新,以反映環境條件的任何變化。使用高級機器學習算法構建的預測模型可以處理PB級的大量數據,并智能地預測容量和性能利用率。這一規劃有助于數據中心避免任何可能導致停機和影響運營的資源短缺。
(3)更快的風險分析
機器學習可以被訓練成比人類更快更準確地檢測異常。數據中心工作人員可能會花費很長時間來發現某些東西,更糟糕的情況是完全忽略了異常情況。例如,一些數據中心管理即服務(DMaaS)程序可以分析來自關鍵數據中心設備(如電源管理和冷卻系統)的性能數據,并預測它們何時可能發生故障。通過提前通知數據中心設備管理人員即將發生的故障,機器學習技術可以將停機時間降至最低。
(4)抵御網絡攻擊的能力
防御分布式拒絕服務(DDoS)攻擊需要快速檢測和低誤報率。這些檢測方法大致分為兩類:基于特征的和基于異常的。基于特征的檢測在一般流量中具有已知特征,并被廣泛實施和使用。基于異常的檢測超出正常流量模式。機器學習回歸模型可用于識別流量異常的類型,有助于最大程度地減少誤報。