服务器故障的可能性主要包括以下4个方面,即服务器的软件故障、操作系统故障、服务器硬件故障和网络服务故障。
1.服務器的軟件故障
服務器的軟件故障是服務器故障中約占70%的、較容易出現的故障。導致服務器出現軟件故障的因素很多,常見的有服務器BIOS版本太低、服務器的管理軟件或服務器的驅動程序有BUG、應用程序有衝突及人為造成(非正常關機、不安操作流程操作)的軟件故障等。同時還有因軟件升級、病毒導致軟件停止運行等原因。軟件故障的診斷較為複雜,首先應確定是否為人為操作不當造成的,可以讓操作人員重現一次故障出現過程以排除人為操作不當因 素。然後根據警示聲響、錯誤代碼、檢查相關日誌及結束可疑程序等進行診斷。最難診斷的是軟件衝突造成的故障,軟件衝突故障更多的是需要維護及管理人員的經驗及觀察。
服務器軟件故障排除包括3個方面:
(1) 經常對FIRMWARE及BI0S進行更新。
(2) 是服務器軟件的更新,經常更新可以解決因BUG等軟件自身原因所造成的軟件故障。但是要注意,不正確的升級方法也會導致機器出現軟件故障。
(3)因人為因素造成的軟件故障,此類故障可以通過正確實用的培訓來解決
2. 操作系統故障
(1)病毒侵襲
蠕蟲病毒侵襲,導致網絡癱瘓,對網絡極具破壞性和殺傷力。可採取以下方式防範病毒攻擊:
只提供網絡服務。除非維護需要,否則,不要直接對服務器進行操作,更不要將服務器作為普通計算機使用,隨意使用服務器瀏覽Web網站、收發電子郵件,以避免由於訪問惡意網頁或郵件,而感染病毒。
關閉不需要的服務。關閉或刪除系統中不需要的服務,只打開網絡服務所必須使用的端口。提供的服務和打開的端口越少,可被利用的安全漏洞也就越少,服 務器就越不容易被惡意攻擊,也就越安全。
安裝系統補丁。絕大多蠕蟲病毒都是利用系統漏洞進行傳播的,及時下載並安裝微軟的Windows Update網站Windows系統(包括應用程序)的安全補丁。
安裝病毒防火牆。僅有系統安全補丁是不夠的,還必須安裝專業的防病毒軟件,並打開防病毒軟件的實時監控功能,及時發現並清除(或隔離)已經感染的病 毒。另外,應當及時升級防病毒程序的病毒庫和引擎,以確保能夠識別並清除最新發現的病毒。
(2)磁盤空間太小
作為服務器,往往需要2GB以上的空間 用於存儲臨時文件。當剩餘的硬盤空間較少時,將嚴重影響服務器的性能,使響應速度變慢,嚴重時甚至會導致系統癱瘓。系統要擁有足夠的剩餘空間。
(3)垃圾文件過多
系統和網絡服務在正常運行過程中會產生一些臨時文件、垃圾文件和磁盤碎片。正常情況下,臨時文件會被系統自動刪除。然而,在非正常關機或應用程序非正常退出時,臨時文件將不會被刪除。隨著使用時間的延長,垃圾文件會越來越多,除了會大量佔用寶貴的硬盤空間外,還將導致系統運行速度變慢。因此,應當定期執行系統工具中的「磁盤清理」,徹底清除不再使用的臨時文件和垃圾文件。
(4)藍屏故障
導致藍屏故障的原因主要非常多,CPU過熱或內存故障、系統硬件衝突、系統缺陷、病毒或黑客攻擊、註冊表中存在錯誤或損壞、啟動時加載程序過多、程序版本衝突、虛擬內存不足造成系統多任務運算錯誤、動態鏈接庫文件丟失、系統資源衝突或資源耗盡等都會產生藍屏。另外,軟/硬件存在衝突也很容易出現藍屏。
藍屏故障的原因及解決
選用同一廠商的產品
確保產品質量
確保散熱良好
只加載服務所必須的程序
刪除多餘的DLL文件
擴大虛擬內存容量
安裝系統補丁和安全補丁
3. 服務器硬件故障
硬件故障並不單單指硬件有問題,它也指硬件之間不兼容。因為服務器的正常運作需要各部件之間的大力協調。建議採購各元件時,都採用用原品牌原裝的配件。非原品牌非原裝的配件,不能支持服務器的某些功能,嚴重的會影響到服務器的正常使用。
由於服務器本身在硬件選用上非常嚴格,所以,通常情況下,在非人為干預情況下,發生服務器故障的可能性比較小。所以,硬件故障往往是在安裝新的板卡、修改系統配置文件,或者進行擴容後發生的。
一般情況下服務器硬件故障主要是:
(1).服務器內部散熱受阻等情況下出現的。因此,服務器要經常檢查其散熱相關部件,察看是否有因灰塵較多影響通風等現象。
(2).硬件耗損出現的硬件故障,常見故障為電源系統、CPU、內存、外部總線及負載系統。
(3).接觸不良在硬件故障中較為常見。其主要發生在各種卡類、內存、CPU等與主板的接觸不良,或電源線、數據線等的連接部到位。
要避免硬件故障發生頻率,服務器管理人員必須注意服務器的溫度、濕度的環境;電壓也要符合。在開、關服務器上必須符合正常的流程。工作人員必須嚴格執行操作流程。
4. 網絡服務故障
由於操作系統Bug、應用程序缺陷、內存質量、硬盤可靠性等各種不可預知的因素,有時會導致網絡服務中斷。
當網絡服務故障發生時,通常都會 在系統日誌有記載,可以通過「管理工具」→「事件查看器」窗口查看。通常情況下,系統故障會記錄在「系統」文件夾,如果是應用程序或非Windows內置 的網絡服務發生故障,則會記錄在「應用程序」文件夾。
當發生網絡故障時,可以採用以下幾個步驟進行處理:
重新啟動服務。依次打開「管理工具」→「服務」窗口,右擊已經發生故障的服務,選擇「啟動」或「重新啟動」。如果網絡服務通過其他控制台管理,也可 在相應的控制台中重新啟動。
重新啟動計算機。當重新啟動服務仍然無法正常實現網絡服務時,可以選擇重新啟動計算機,清除計算機內存重新加載網絡服務。
重新安裝服務或應用程序。如果重新啟動計算機仍然不能排除故障,可以考慮卸載並重新安裝相應的Windows組件或應用程序。