從數據中心服務器方面考慮,則主要有文件系統、內核參數調優、各種硬盤驅動、內核版本等。掌握Windows、Linux、虛擬化系統的使用能更好地處理服務器和網絡設備的運維工作。要對服務器的運行狀態和內核運行狀態進行監控與管理,減少服務器故障的發生。一般大型的數據中心都包含有成千上萬台的服務器,幾乎每天都會有服務器出現各種各樣的問題,只有對服務器有深入理解才能很好地消除問題。為了防止服務器故障引發業務中斷,所以一般在服務器上都要部署虛擬化技術或者集群技術,當一台服務器物理硬件故障時,業務可以平滑切換到其它服務器上,業務不會受到任何影響。
從數據中心存儲方面考慮,架構更加多樣和複雜化。在雲計算、虛擬化、大數據等相關技術進入數據中心後,需要瞭解多種數據類型的存儲方式。集中式存儲已經不再是數據中心的主流存儲架構,海量數據的存儲訪問,需要擴展性、伸縮性極強的分佈式存儲架構來實現。在大規模系統支撐上,分佈式文件系統、分佈式對像存儲等技術,為存儲的各種應用提供了高度可伸縮、可擴展和極大的彈性支撐和強大的數據訪問性能,並且因為這些分佈式技術對標準化硬件的支持,使得大規模數據中心存儲得以低成本的建設和運維。當然分佈式存儲不是要取代現有的盤陣,而是為了應付高速成長的數據量與帶寬而產生的新形態存儲系統。對於數據中心用戶而言,通過軟件來實現對存儲資源的管理和調度,實現存儲資源的虛擬化 、抽像化、自動化,能夠完整的實現數據中心存儲系統的部署、管理、監控、調整等多個要求,使得存儲系統具備靈活、自由和高可用等特點。
最後從數據中心安全方面來考慮,安全就是十幾個小項:攻擊保護、升級備份、抓BUG/找BUG、腳本工具、數據安全、服務巡檢等項目,其中每一項拿出來其實都包含很多的內容。比如說到攻擊與保護,這個主要指的是防止外來的異常入侵者對數據中心發起的惡意和無意攻擊,惡意攻擊就是有人故意的使用各種攻擊方法,進入到數據中心內部,將重要的數據竊取或者破壞,達到其不可告人的目的。也有的是無意的攻擊,因為整個數據中心是要與外界保持互聯互通的,運行是動態的,變化的,不可避免會有一些異常流量攻擊數據中心,有時甚至來自於數據中心內部,比如某些服務器中毒,或者硬件故障,構造出了環路,異常流量等網絡故障,這些都會影響到數據中心的運行,所以如何做好數據中心的攻擊與保護是一個很大的題目,這並不是在數據中心裡部署幾台安全設備就能解決的,需要對整個數據中心進行全面的統一規劃,並有針對性地部署一些安全防護措施。
數據中心運維包含大大小小數十項,每一項包含的內容說起來都不那麼簡單,也涉及很多的技術知識。一個數據中心能否穩定運行,能夠高效運行,運維是關鍵。只有將這些運維工作很好地部署和執行下去,數據中心才能長期穩定的運行。