網(wǎng)絡(luò)管理不善會嚴重影響企業(yè)所依賴的所有服務(wù)器、應(yīng)用程序和服務(wù)。這就是為什么網(wǎng)絡(luò)管理員采取網(wǎng)絡(luò)運行管理任務(wù)認真對待并以最高標準要求他們。本文探討了10項重要的網(wǎng)絡(luò)管理任務(wù),以及網(wǎng)絡(luò)管理員可以用來正確執(zhí)行這些任務(wù)的最佳實踐和工具。
1.網(wǎng)絡(luò)配置和供應(yīng)
網(wǎng)絡(luò)管理最基本的要素之一是網(wǎng)絡(luò)供應(yīng)。該過程包括以下任務(wù):
- 設(shè)置網(wǎng)絡(luò)設(shè)備,如路由器和防火墻。
- 手動分配IP地址或者通過動態(tài)主機配置協(xié)議。
- 配置虛擬局域網(wǎng)和虛擬專用網(wǎng)。
網(wǎng)絡(luò)管理員可以使用配置模板設(shè)計網(wǎng)絡(luò),有時也稱為樣板文件-并根據(jù)需要進行更新。這些模板的目的有兩個。首先,它們有助于管理員更快地配置新設(shè)備進行部署。其次,模板有助于確保不同設(shè)備的配置一致。
網(wǎng)絡(luò)自動化平臺幫助管理員管理網(wǎng)絡(luò)配置。例如,這些平臺可以同時存儲設(shè)備信息、驗證配置更改和部署配置。軟件定義的網(wǎng)絡(luò)技術(shù)還將所有網(wǎng)絡(luò)配置集中在控制平面內(nèi)。
2.網(wǎng)絡(luò)監(jiān)控和警報
網(wǎng)絡(luò)管理員必須密切關(guān)注觀察企業(yè)網(wǎng)絡(luò)的運行狀況確保正常運行時間和最佳性能。網(wǎng)絡(luò)監(jiān)控工具有助于跟蹤網(wǎng)絡(luò)活動、數(shù)據(jù)包丟失和停機時間。網(wǎng)絡(luò)團隊可以使用簡單網(wǎng)絡(luò)管理協(xié)議、syslog、NetFlow、遙測和深度數(shù)據(jù)包檢測等協(xié)議和健康監(jiān)控服務(wù)來幫助監(jiān)控,并在出現(xiàn)問題時自動觸發(fā)警報。
網(wǎng)絡(luò)監(jiān)控的重要指標包括:
- 潛伏。
- 抖動。
- 吞吐量。
- 帶寬使用。
3.故障排除和根本原因分析
當網(wǎng)絡(luò)出現(xiàn)故障、中斷或性能問題時,網(wǎng)絡(luò)管理員負責盡快識別和修復(fù)問題。作為故障管理流程的一部分,管理員應(yīng)該執(zhí)行徹底的根本原因分析,以確定并修復(fù)故障原因。管理員還應(yīng)該記錄他們做了什么來消除威脅,或者至少減少事件對組織的影響。
常見的網(wǎng)絡(luò)中斷包括瓶頸、連接問題、DNS問題和虛擬局域網(wǎng)配置錯誤。網(wǎng)絡(luò)分析器工具,例如Wireshark和tcpdump提供有關(guān)網(wǎng)絡(luò)數(shù)據(jù)包的信息,有助于故障排除過程。同時,現(xiàn)代AIOps工具使用人工智能和機器學習來幫助自動化故障診斷和根本原因分析過程。
4.變更控制管理
當管理員需要對生產(chǎn)網(wǎng)絡(luò)進行網(wǎng)絡(luò)更改時,他們必須從頭到尾嚴密控制整個過程。這包括建立訪問控制,以規(guī)定誰可以進行更改、應(yīng)在什么時間范圍內(nèi)進行更改、應(yīng)如何宣布更改以及對提議的更改進行同行審查。
雖然以網(wǎng)絡(luò)為中心的變更控制管理工具是可用的,但是大多數(shù)企業(yè)IT部門選擇集中式的變更控制所有團隊都可以使用的平臺。這些工具通常是IT部門服務(wù)標簽平臺的一部分,或者與其直接集成。
5.固件錯誤和漏洞修補
修補和漏洞掃描是網(wǎng)絡(luò)安全和網(wǎng)絡(luò)管理不可或缺的一部分。管理員應(yīng)確保經(jīng)常修補網(wǎng)絡(luò)設(shè)備固件、服務(wù)器操作系統(tǒng)和軟件。由于大量的操作錯誤和更重要的安全漏洞,頻繁的修補是必要的。
管理員應(yīng)制定流程,使他們能夠?qū)彶楣碳抡f明,以驗證已知的錯誤或漏洞是否會對業(yè)務(wù)產(chǎn)生重大影響。根據(jù)這項研究,他們應(yīng)該像處理任何其他網(wǎng)絡(luò)更改一樣處理固件修補,這需要經(jīng)過一個徹底的更改控制流程。
6.結(jié)構(gòu)管理
定期備份和安全存儲對于跟蹤網(wǎng)絡(luò)設(shè)備的配置至關(guān)重要。許多傳統(tǒng)網(wǎng)絡(luò)設(shè)備仍然使用命令行界面進行配置和管理,但備份有助于確保在發(fā)生災(zāi)難性硬件故障或數(shù)據(jù)丟失時更快地恢復(fù)。擁有這些配置的文本副本至關(guān)重要,管理員可以將其粘貼到備用或替換設(shè)備中。這些內(nèi)部政策和恢復(fù)計劃應(yīng)包括文件加密流程和對備份文件存儲庫的有限訪問。
在云管理的網(wǎng)絡(luò)架構(gòu)中,服務(wù)提供商通常負責維護和保護配置備份。然而,一些云網(wǎng)絡(luò)服務(wù)提供商允許客戶在他們選擇的任何地方復(fù)制和存儲他們的配置。在這些情況下,企業(yè)將備份存儲在提供商的云之外非常重要,以防服務(wù)提供商出現(xiàn)重大故障。
7.策略和合規(guī)性驗證
管理員必須定期審查所有網(wǎng)絡(luò)策略,以確保網(wǎng)絡(luò)不僅從性能角度優(yōu)化,而且從安全性、合規(guī)性和法規(guī)角度優(yōu)化。根據(jù)組織運營的業(yè)務(wù)類型,團隊必須執(zhí)行并定期審查以下合規(guī)性標準,其中包括:
- 薩班斯-奧克斯利法案。
- 支付卡行業(yè)。
- HIPAA。
- 一般數(shù)據(jù)保護條例。
網(wǎng)絡(luò)審計和更新文檔幫助網(wǎng)絡(luò)團隊確保網(wǎng)絡(luò)工具和策略符合合規(guī)性要求,并維護準確的信息。包含自動化安全性和合規(guī)性驗證的網(wǎng)絡(luò)自動化工具有助于加快驗證過程。
8.網(wǎng)絡(luò)文檔
網(wǎng)絡(luò)文檔跟蹤有關(guān)網(wǎng)絡(luò)拓撲、設(shè)備配置、IP地址記錄、網(wǎng)絡(luò)圖、布線、安全策略和其他網(wǎng)絡(luò)資源的信息。
隨著網(wǎng)絡(luò)復(fù)雜性的增加,維護詳細準確的物理和邏輯網(wǎng)絡(luò)圖比以往任何時候都更加重要。雖然經(jīng)驗豐富的網(wǎng)絡(luò)工程師可能更喜歡使用Microsoft Visio等工具來繪制和更新他們自己手動創(chuàng)建的圖表,但許多人認為他們的網(wǎng)絡(luò)太復(fù)雜,變化太頻繁,無法跟上。因此,自動掃描和繪制網(wǎng)絡(luò)拓撲的工具正在成為一種流行的選擇。雖然這些自動化的圖表在視覺上可能不夠吸引人,或者沒有包含所有必要的信息,但是管理員至少可以確信它們是最新的。
9.網(wǎng)絡(luò)彈性
任務(wù)關(guān)鍵型網(wǎng)絡(luò)的設(shè)計和構(gòu)建都考慮到了高可用性。這包括物理布線冗余、動態(tài)路由協(xié)議和生產(chǎn)硬件故障時的備用設(shè)備維護等因素。網(wǎng)絡(luò)彈性任務(wù)還包括在發(fā)生故障時定期測試和評估網(wǎng)絡(luò)彈性響應(yīng)時間的步驟。
的另一個重要部分驗證網(wǎng)絡(luò)彈性確保生產(chǎn)硬件和軟件得到適當?shù)脑S可,并在適當級別的支持合同下。這包括了解硬件更換時間、供應(yīng)商支持時間和方法,以及從頭到尾解決常見問題所需的詳細步驟。
10.短期和長期路線圖
最后,網(wǎng)絡(luò)管理員應(yīng)該準備好創(chuàng)建短期和長期網(wǎng)絡(luò)架構(gòu)路線圖的流程。這些練習有助于了解網(wǎng)絡(luò)的現(xiàn)狀、近期能力以及決定未來重大升級的催化劑。
這一步包括容量規(guī)劃,以確保網(wǎng)絡(luò)能夠處理現(xiàn)有和未來的需求。它還要求管理員閱讀、研究和接收新興網(wǎng)絡(luò)技術(shù)的演示。這樣做有助于管理員規(guī)劃后續(xù)步驟,避免將網(wǎng)絡(luò)設(shè)計到死角。