崗位職責(zé):
1. 平臺(tái)開發(fā)與部署:
? 設(shè)計(jì)、開發(fā)和維護(hù)基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)平臺(tái)(如HDFS、YARN、Hive、Spark、HBase等)。
? 開發(fā)和優(yōu)化數(shù)據(jù)管道(Data Pipeline),支持?jǐn)?shù)據(jù)采集、存儲(chǔ)、處理和分析。
? 編寫和維護(hù)自動(dòng)化腳本(如Shell、Python)以簡(jiǎn)化部署和管理流程。
2. 平臺(tái)運(yùn)維與監(jiān)控:
? 負(fù)責(zé)Hadoop集群的日常運(yùn)維,包括安裝、配置、升級(jí)和故障排除。
? 監(jiān)控集群性能,優(yōu)化資源利用率,確保系統(tǒng)高可用性和穩(wěn)定性。
? 使用監(jiān)控工具(如Ganglia、Nagios、Prometheus等)實(shí)時(shí)監(jiān)控集群狀態(tài),及時(shí)發(fā)現(xiàn)并解決問題。
3. 性能優(yōu)化:
? 分析和優(yōu)化Hadoop集群的性能,解決數(shù)據(jù)傾斜、資源爭(zhēng)用等問題。
? 優(yōu)化MapReduce、Spark等計(jì)算框架的任務(wù)執(zhí)行效率。
? 調(diào)整HDFS存儲(chǔ)策略,優(yōu)化數(shù)據(jù)讀寫性能。
4. 安全管理:
? 配置和管理Hadoop平臺(tái)的安全機(jī)制,包括Kerberos認(rèn)證、權(quán)限控制(ACL)和數(shù)據(jù)加密。
? 定期進(jìn)行安全審計(jì),確保平臺(tái)符合公司安全政策和行業(yè)標(biāo)準(zhǔn)。
5. 故障排查與恢復(fù):
? 快速定位和解決Hadoop集群中的故障,包括硬件故障、網(wǎng)絡(luò)問題和軟件異常。
? 制定和實(shí)施災(zāi)難恢復(fù)計(jì)劃,確保數(shù)據(jù)安全
任職要求:
1. 教育背景:
? 計(jì)算機(jī)科學(xué)、信息技術(shù)、軟件工程或相關(guān)專業(yè)本科及以上學(xué)歷。
2. 工作經(jīng)驗(yàn):
? 4年以上大數(shù)據(jù)平臺(tái)開發(fā)或運(yùn)維經(jīng)驗(yàn),熟悉Hadoop生態(tài)系統(tǒng)及其核心組件(如HDFS、YARN、Hive、Spark、HBase等)。
? 有大規(guī)模集群(100+節(jié)點(diǎn))運(yùn)維經(jīng)驗(yàn)者優(yōu)先。
3. 技術(shù)技能:
? 熟練掌握Hadoop生態(tài)系統(tǒng)的部署、配置和優(yōu)化。
? 熟悉至少一種編程語(yǔ)言(如Java、Python、Scala)。
? 熟悉Linux操作系統(tǒng),具備Shell腳本編寫能力。
? 熟悉大數(shù)據(jù)處理框架(如MapReduce、Spark、Flink)。
? 熟悉數(shù)據(jù)倉(cāng)庫(kù)工具(如Hive、Impala)和消息隊(duì)列(如Kafka)。
? 了解容器化技術(shù)(如Docker、Kubernetes)和云計(jì)算平臺(tái)(如AWS、Azure、阿里云)者優(yōu)先。
4. 軟技能:
? 具備良好的問題分析和解決能力。
? 具備較強(qiáng)的溝通能力和團(tuán)隊(duì)協(xié)作精神。
? 能夠在高壓環(huán)境下工作,具備快速學(xué)習(xí)和適應(yīng)新技術(shù)的能力。