職位描述

崗位職責
1、保障大規(guī)模K8S集群的穩(wěn)定運行,可以快速定位及解決K8S集群中的問題,工作內(nèi)容包含:宿主資源管理、集群生命周期管理,核心組件變更、證書管理等、巡檢、重保、數(shù)據(jù)備份和恢復;
2、善于通過自動化手段提升工作效率,開發(fā)自動化工具提升oncall效率
3. 有大規(guī)模GPU集群管理經(jīng)驗 , 熟悉訓練和推理的基本邏輯,了解機器學習的常用框架,可以快速處理GPU相關的需求和問題 。
職位要求
1、本科及以上學歷,計算機或者相關專業(yè),2年以上運維相關工作經(jīng)驗,有CKA證書優(yōu)先;
2、精通Linux操作系統(tǒng),熟悉TCP/IP、HTTP等協(xié)議,有良好的網(wǎng)絡、存儲、安全、計算機體系結構方面的知識等。
3、精通kubernetes/docker的架構技術及其內(nèi)部實現(xiàn)原理,至少3年Kubernetes實際業(yè)務編排、管理及運維經(jīng)驗,有容器技術、kubernetes、Dorker等開發(fā)經(jīng)驗者優(yōu)先。
4、熟悉Ansible等自動化運維技術,能熟練使用python/Golang其中至少一種語言運維開發(fā),優(yōu)先考慮會編寫opeator者,善于通過自動化方式解決運維工作中標準操作流程。
5、具有良好溝通能力和服務意識,能夠獨立解決項目的問題,善于總結和編寫文檔。
6、有工作熱情,較強的學習能力,高度的責任心、良好的溝通技巧和團隊合作精神。
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)海淀區(qū)上地元中心


職位發(fā)布者
HR
小米科技有限責任公司


-
通信/電信/網(wǎng)絡設備/增值服務
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)清河中街68號華潤五彩城寫字樓