職責(zé)
1、服務(wù)器、存儲資源、操作系統(tǒng)相關(guān)緊急事件遵循相關(guān)通知和處理的原則和流程,及時(shí)通知相關(guān)接口人進(jìn)行處理;
2、負(fù)責(zé)定期對機(jī)房內(nèi)服務(wù)器、存儲、操作系統(tǒng)、中間件等軟硬件設(shè)備健康狀態(tài)進(jìn)行巡檢,并完成巡檢記錄,定期對算力集群計(jì)算節(jié)點(diǎn)、存儲節(jié)點(diǎn)等的狀態(tài)、容量、告警信息等進(jìn)行巡檢;
3、負(fù)責(zé)服務(wù)請求工單處理,根據(jù)用戶需求負(fù)責(zé)受理和記錄服務(wù)請求工單,并參與算力資源的交付,同時(shí)負(fù)責(zé)跟蹤處理進(jìn)度、反饋處理結(jié)果、用戶電話回訪等,保證客戶的滿意度;
4、做好日常工作交接班管理。
要求
1、??萍耙陨蠈W(xué)歷;
2、具備1年及以上主流物理服務(wù)器、操作系統(tǒng)交付或者維護(hù)經(jīng)驗(yàn)。
3、熟悉GPU服務(wù)器、通算服務(wù)器主要部件的基本工作原理,具備服務(wù)器日?;A(chǔ)巡檢、常見故障的排查能力,能夠完成日?;A(chǔ)性維護(hù)工作;
4、熟悉Linux操作系統(tǒng)的日常維護(hù)、問題排查 5、具備服務(wù)器及操作系統(tǒng)相關(guān)認(rèn)證證書人員優(yōu)先,服務(wù)器及操作系統(tǒng)相關(guān)認(rèn)證證書包含:RHCA、RHCE、RHCSA、ACP、VCP、VCAP、MCP、CKA、UCP、KYCP、HCIP-openEuler、NCA-AIIO認(rèn)證等(英偉達(dá)認(rèn)證助理-AI基礎(chǔ)設(shè)施與運(yùn)維)。