- 相關(guān)推薦
運(yùn)維個(gè)人年終述職報(bào)告
隨著個(gè)人的文明素養(yǎng)不斷提升,報(bào)告使用的頻率越來(lái)越高,報(bào)告根據(jù)用途的不同也有著不同的類型。我們應(yīng)當(dāng)如何寫(xiě)報(bào)告呢?以下是小編收集整理的運(yùn)維個(gè)人年終述職報(bào)告,歡迎大家分享。
運(yùn)維工程師對(duì)一個(gè)公司來(lái)說(shuō)是非常重要的崗位,它本身所覆蓋的運(yùn)維職責(zé)就很重要,所以,運(yùn)維對(duì)其它關(guān)聯(lián)工種必須非常了解熟悉:網(wǎng)絡(luò)、系統(tǒng)、系統(tǒng)開(kāi)發(fā)、存儲(chǔ),安全,DB等。作為一個(gè)運(yùn)維工程師我認(rèn)為是集合網(wǎng)絡(luò)、系統(tǒng)、開(kāi)發(fā)工作于一身的“復(fù)合型人才”,就如有些公司把一些合同采購(gòu)都納入了運(yùn)維職責(zé)范圍,還有如IDC網(wǎng)絡(luò)規(guī)劃也納入運(yùn)維職責(zé)。
一、運(yùn)維工程師崗位職責(zé)
1、參與設(shè)計(jì)、審核、優(yōu)化公司IT系統(tǒng)以及各應(yīng)用系統(tǒng)的體系架構(gòu);
2、全面負(fù)責(zé)公司運(yùn)維項(xiàng)目的系統(tǒng)升級(jí)、擴(kuò)容需求與資源落實(shí),配合開(kāi)發(fā)需求,測(cè)試、調(diào)整運(yùn)維平臺(tái);
3、負(fù)責(zé)網(wǎng)絡(luò)以及服務(wù)器的網(wǎng)絡(luò)設(shè)置、維護(hù)和優(yōu)化、網(wǎng)絡(luò)的安全監(jiān)控、系統(tǒng)性能管理和優(yōu)化、網(wǎng)絡(luò)性能管理和優(yōu)化;
4、建立面向開(kāi)發(fā)部門(mén),業(yè)務(wù)部門(mén)的服務(wù)流程和服務(wù)標(biāo)準(zhǔn);
5、負(fù)責(zé)IT運(yùn)維相關(guān)流程的規(guī)劃、設(shè)計(jì)、推行、實(shí)施和持續(xù)改進(jìn);
6、響應(yīng)及解決客戶的技術(shù)要求、疑問(wèn)以及系統(tǒng)使用過(guò)程中遇到的各種問(wèn)題;
7、負(fù)責(zé)日常網(wǎng)絡(luò)及各子系統(tǒng)管理維護(hù)。
8、負(fù)責(zé)設(shè)計(jì)并部署相關(guān)應(yīng)用平臺(tái),并提出平臺(tái)的實(shí)施、運(yùn)行報(bào)告。
9、負(fù)責(zé)配合開(kāi)發(fā)搭建測(cè)試平臺(tái),協(xié)助開(kāi)發(fā)設(shè)計(jì)、推行、實(shí)施和持續(xù)改進(jìn)。
10、負(fù)責(zé)相關(guān)故障、疑難問(wèn)題排查處理,編制匯總故障、問(wèn)題,定期提交匯總報(bào)告。
11、負(fù)責(zé)網(wǎng)絡(luò)監(jiān)控和應(yīng)急反應(yīng),以確保網(wǎng)絡(luò)系統(tǒng)有7*24小時(shí)的持續(xù)運(yùn)作能力。
12、負(fù)責(zé)日常系統(tǒng)維護(hù),及監(jiān)控,提供IT軟硬件方面的服務(wù)和支持,保證系統(tǒng)的穩(wěn)定。
13、負(fù)責(zé)服務(wù)過(guò)程中問(wèn)題現(xiàn)象和處理方案的收集撰寫(xiě),形成知識(shí)庫(kù),并對(duì)知識(shí)庫(kù)進(jìn)行維護(hù)更 新;
14、及時(shí)反饋技術(shù)處理過(guò)程中的異常情況,及時(shí)向部門(mén)負(fù)責(zé)人、服務(wù)開(kāi)發(fā)PM、客戶經(jīng)理等相關(guān)人員報(bào)警;同時(shí),主動(dòng)協(xié)調(diào)資源推動(dòng)問(wèn)題解決;
15、定期對(duì)所有服務(wù)問(wèn)題進(jìn)行分析,并對(duì)服務(wù)效率有影響的問(wèn)題提供反饋意見(jiàn),提升服務(wù)支持團(tuán)隊(duì)專業(yè)度;
二、 怎樣才算是一個(gè)合格的運(yùn)維工程師
1、保證服務(wù)達(dá)到要求的線上標(biāo)準(zhǔn),如99、9%;保證線上穩(wěn)定,這是運(yùn)維工程師的基本責(zé)職所在。
2、不斷的提升應(yīng)用的可靠性與健壯性、性能優(yōu)化、安全提升;這方面非常考驗(yàn)主動(dòng)性和創(chuàng)新思維。
3、網(wǎng)站各層面監(jiān)控、統(tǒng)計(jì)的覆蓋度,軟件、硬件、運(yùn)行狀態(tài),能監(jiān)控的都需要監(jiān)控統(tǒng)計(jì),避免監(jiān)控死角、并能實(shí)時(shí)了解應(yīng)用的運(yùn)轉(zhuǎn)情況。
4、通過(guò)創(chuàng)新思維解決運(yùn)維效率問(wèn)題;目前各公司大部份運(yùn)維主要工作還是依賴人工操作干預(yù),需要盡可能的解放雙手。
5、運(yùn)維知識(shí)的積累與沉淀、文檔的完備性,運(yùn)維是一個(gè)經(jīng)驗(yàn)性非常強(qiáng)的崗位,好的經(jīng)驗(yàn)與陷阱都需積累下來(lái),避免重復(fù)性范錯(cuò)。
6、計(jì)劃性和執(zhí)行力;工作有計(jì)劃,計(jì)劃后想法設(shè)法達(dá)到目標(biāo),不找借口。
7、自動(dòng)化運(yùn)維;能對(duì)日常機(jī)械化工作進(jìn)行提煉、設(shè)計(jì)并開(kāi)發(fā)成工具、系統(tǒng),能讓系統(tǒng)自動(dòng)完成的盡量依靠系統(tǒng);讓大家更多的時(shí)間用于思考、創(chuàng)新思維、做自已喜歡的事情。 以上只是技術(shù)上的一些層面,當(dāng)然個(gè)人意識(shí)也是很重要的。
三、運(yùn)維管理注意事項(xiàng)
1、配置管理
(1)it資產(chǎn)配置管理:對(duì)it資產(chǎn)生命周期進(jìn)行管理,包括分類統(tǒng)計(jì)、預(yù)購(gòu)、選購(gòu)審核、轉(zhuǎn)移審核、報(bào)廢審核,保證配置管理正確率達(dá)標(biāo);
(2)建設(shè)案例庫(kù):累積和提煉工程師的事件處理經(jīng)驗(yàn)制作成案例,并持續(xù)豐富運(yùn)維案例庫(kù)供查詢,案例覆蓋已知事件的比率達(dá)標(biāo),不斷提高運(yùn)維工程師工作效率;
(3)it系統(tǒng)配置信息管理:定期更新網(wǎng)絡(luò)及應(yīng)用系統(tǒng)描述信息及技術(shù)支持信息配置,保證最新;將配置文檔上傳至服務(wù)器端,方便團(tuán)隊(duì)其他運(yùn)維人員進(jìn)行查看和操作。
2、監(jiān)控
主要包括故障監(jiān)控和性能、流量、負(fù)載等狀態(tài)監(jiān)控,這些監(jiān)控關(guān)系到集群的健康運(yùn)行,及潛在問(wèn)題的及時(shí)發(fā)現(xiàn)與干預(yù);
(1)、服務(wù)故障、狀態(tài)監(jiān)控:主要是對(duì)服務(wù)器自身、上層應(yīng)用、關(guān)聯(lián)服務(wù)數(shù)據(jù)交互監(jiān)控;例如針對(duì)前端web server,我們就可以有很多種類型的監(jiān)控,像zabbix,nagios,cacti等監(jiān)控程序。
(2)、其它就是集群狀態(tài)類的監(jiān)控或統(tǒng)計(jì),為我們合理管理調(diào)優(yōu)集群提供數(shù)據(jù)參考、包括服務(wù)瓶頸、性能問(wèn)題、異常流量、攻擊等問(wèn)題。
3、故障管理
(1)、硬件故障問(wèn)題;對(duì)于成百上千或上萬(wàn)機(jī)器的N多集群,服務(wù)器死機(jī)、硬件故障概率是非常大的,幾乎每時(shí)每刻都有服務(wù)硬件問(wèn)題,死機(jī)、硬盤(pán)損壞、電源、內(nèi)存、交換機(jī)。針對(duì)這種情況,我們?cè)谠O(shè)計(jì)網(wǎng)站架構(gòu)時(shí)需要充分考慮到這些問(wèn)題,并將其視為常態(tài);更多的依靠應(yīng)用的冗余機(jī)制來(lái)規(guī)避這種風(fēng)險(xiǎn),給系統(tǒng)工程師足夠?qū)捲5奶幚頃r(shí)間。(如google不是號(hào)稱同時(shí)死800臺(tái)機(jī)器,服務(wù)不會(huì)受到任何影響嗎);這就是考驗(yàn)運(yùn)維工程師及網(wǎng)站架構(gòu)師功能的地方了,好的設(shè)計(jì)能達(dá)到google所描述自恢復(fù)能力,如gfs,糟糕的設(shè)計(jì)那就是一臺(tái)服務(wù)器的死機(jī)可能會(huì)造成大面積服務(wù)的連鎖故障反映,直接對(duì)用戶拒絕響應(yīng)。
(2)、應(yīng)用故障問(wèn)題;可能是某一bug被觸發(fā)、或某一性能閥值被超越、攻擊等情況不一而定,但重要的一點(diǎn),是要有對(duì)這些問(wèn)題的預(yù)防性措施,不能想當(dāng)然,它不會(huì)出問(wèn)題,如真出問(wèn)題了,如何應(yīng)對(duì)?這需要運(yùn)維工程師平時(shí)做足功夫,包括應(yīng)急響應(yīng)速度、故障處理的科學(xué)性、備用方案的有效等。
4、問(wèn)題管理
對(duì)事件進(jìn)行統(tǒng)計(jì)分析,找出疑難、重復(fù)發(fā)生的事件,納入問(wèn)題管理流程,分析問(wèn)題產(chǎn)生的根本原因,確定可能解決的方案,需要修改網(wǎng)絡(luò)或應(yīng)用系統(tǒng)配置時(shí)提交變更申請(qǐng)觸發(fā)變更管理流程。
5、安全管理
(1)、操作人員隨時(shí)監(jiān)控中心設(shè)備運(yùn)行狀況,發(fā)現(xiàn)異常情況應(yīng)立即按照應(yīng)急預(yù)案規(guī)程進(jìn)行操作,并及時(shí)上報(bào)和詳細(xì)記錄。
(2)、未經(jīng)批準(zhǔn),不得在機(jī)房設(shè)備上隨意編寫(xiě)、修改、更換各類軟件系統(tǒng)及更改設(shè)備參數(shù)配置;
(3)、服務(wù)器系統(tǒng)的維護(hù)、增刪、配置的更改,必須按規(guī)定詳細(xì)記入相關(guān)記錄,并對(duì)各類記錄和檔案整理存檔。
(4)、機(jī)房工作人員應(yīng)恪守保密制度,不得擅自泄露信息資料與數(shù)據(jù)。
(5)、嚴(yán)禁在機(jī)房計(jì)算機(jī)設(shè)備上做與工作無(wú)關(guān)的事情(如聊天、玩游戲),對(duì)外來(lái)存儲(chǔ)設(shè)備(如U盤(pán)、移動(dòng)硬盤(pán)等),做到先殺病毒后使用。
(6)、機(jī)房嚴(yán)禁亂拉接電源,應(yīng)不定期對(duì)機(jī)房?jī)?nèi)設(shè)置的消防器材、煙霧報(bào)警、恒溫設(shè)備進(jìn)行檢查,保障機(jī)房安全。
6、自動(dòng)化運(yùn)維
自動(dòng)化:簡(jiǎn)而言之,就是將我們?nèi)粘J謩?dòng)進(jìn)行的一些工作通過(guò)工具,系統(tǒng)自動(dòng)來(lái)完成,解放我們的雙手及枯燥的重復(fù)性勞動(dòng),例如:沒(méi)有工具前,我們安裝系統(tǒng)需要一臺(tái)一臺(tái)裸機(jī)安裝,如20xx臺(tái),可能需要10人/10天,搞爛N張光盤(pán),人力成本更大,而現(xiàn)在通過(guò)自動(dòng)化工具,只需幾個(gè)簡(jiǎn)單命令就能搞定、還有如機(jī)器人類程序,自動(dòng)完成以往每天人工干預(yù)的工作,使其自動(dòng)完成、匯報(bào)結(jié)果,并具備一定的專家系統(tǒng)能力,能做一些簡(jiǎn)單的是/非判斷、優(yōu)化選擇等,這些好處非常明顯不再多說(shuō)。應(yīng)該說(shuō),自動(dòng)化運(yùn)維是運(yùn)維工程師職業(yè)化的一個(gè)追求,利已利公,雖然這是一個(gè)異常艱巨的任務(wù):不斷變更的業(yè)務(wù)、不規(guī)范化的應(yīng)用設(shè)計(jì)、開(kāi)發(fā)模式、網(wǎng)絡(luò)架構(gòu)變更、IDC變更、規(guī)范變動(dòng)等因素,都可能會(huì)對(duì)現(xiàn)有自動(dòng)化系統(tǒng)產(chǎn)生影響,所以需要模塊化、接口化、變因參數(shù)化等因此,自動(dòng)化相關(guān)工作,是運(yùn)維工程師的核心重點(diǎn)工作之一,也是價(jià)值的體現(xiàn)。
四、總結(jié)
綜上所述,做一個(gè)好的運(yùn)維工程師,除了具備良好的綜合技能水平,還要有一個(gè)負(fù)責(zé)任的工作態(tài)度,這也是優(yōu)秀運(yùn)維工程師具備的素質(zhì)。因?yàn)閷?duì)于運(yùn)維工程師而言,每一次故障的發(fā)生都不是小事,很可能會(huì)影響公司線上業(yè)務(wù)的穩(wěn)定性,甚至直接導(dǎo)致公司的經(jīng)濟(jì)損失,所以我認(rèn)為對(duì)待工作中發(fā)生的故障以及事件要秉著一個(gè)“小事件,大處理”的原則,將發(fā)生的故障扼殺到搖籃里,慢慢地積累故障處理經(jīng)驗(yàn),這樣當(dāng)真正的大事件來(lái)臨時(shí),我們可以采取有效的措施及時(shí)應(yīng)對(duì)。除了處理好發(fā)生的故障事件,我覺(jué)得運(yùn)維工程師還應(yīng)具備可預(yù)見(jiàn)性,故障隨時(shí)可能發(fā)生,如何防患于未然,這將是對(duì)我們做好運(yùn)維工作的一個(gè)考驗(yàn)。古人云:“不積跬步無(wú)以至千里,不積小流無(wú)以成江!边\(yùn)維之路就是由一次次故障事件中拼接出來(lái)的,作為其中的一份子,任重而道遠(yuǎn)!
【運(yùn)維個(gè)人年終述職報(bào)告】相關(guān)文章:
運(yùn)維年終述職報(bào)告04-29
網(wǎng)絡(luò)運(yùn)維述職報(bào)告03-26
運(yùn)維年終述職報(bào)告范文04-27
運(yùn)維工程師述職報(bào)告02-20
運(yùn)維工作個(gè)人總結(jié)(合集)01-14
運(yùn)維監(jiān)控03-12