工作職責(zé):
1.大數(shù)據(jù)平臺(tái)架構(gòu)與開發(fā):主導(dǎo)企業(yè)級(jí)數(shù)據(jù)平臺(tái)核心模塊架構(gòu)設(shè)計(jì)與編碼實(shí)現(xiàn),負(fù)責(zé)數(shù)據(jù)接入層、計(jì)算引擎層、存儲(chǔ)層的性能優(yōu)化與穩(wěn)定性保障,支撐PB級(jí)數(shù)據(jù)量與高并發(fā)查詢場(chǎng)景。
2.實(shí)時(shí)計(jì)算引擎研發(fā):負(fù)責(zé)Flink/Spark Streaming實(shí)時(shí)計(jì)算鏈路的深度定制與優(yōu)化,保障流式數(shù)據(jù)處理低延遲、高吞吐,支持大規(guī)模任務(wù)并行,沉淀實(shí)時(shí)計(jì)算開發(fā)規(guī)范與通用算子庫(kù)
3.數(shù)據(jù)服務(wù)與治理:開發(fā)企業(yè)級(jí)數(shù)據(jù)目錄、數(shù)據(jù)發(fā)現(xiàn)、主題構(gòu)建等治理能力,實(shí)現(xiàn)跨數(shù)據(jù)源的聯(lián)邦查詢與統(tǒng)一視圖管理;設(shè)計(jì)數(shù)據(jù)質(zhì)量監(jiān)控與血緣追蹤體系,提升數(shù)據(jù)可觀測(cè)性
4.存儲(chǔ)與資源優(yōu)化:負(fù)責(zé)PB級(jí)數(shù)據(jù)存儲(chǔ)的容量規(guī)劃與成本優(yōu)化,實(shí)施冷熱分層、壓縮轉(zhuǎn)儲(chǔ)等策略;優(yōu)化OLAP集群(Doris/ClickHouse)性能,保障查詢響應(yīng)時(shí)間<1秒
5.云原生與后端能力:負(fù)責(zé)數(shù)據(jù)服務(wù)的容器化改造與K8s部署,實(shí)現(xiàn)GPU資源調(diào)度與彈性伸縮;開發(fā)統(tǒng)一數(shù)據(jù)API、權(quán)限控制、審計(jì)日志等后端服務(wù),構(gòu)建安全可靠的系統(tǒng)底座
6.技術(shù)標(biāo)準(zhǔn)化與賦能:沉淀數(shù)據(jù)中臺(tái)技術(shù)規(guī)范,封裝通用ETL模板、UDF函數(shù)庫(kù)與連接器;開展技術(shù)分享與Code Review,培養(yǎng)初級(jí)大數(shù)據(jù)工程師,提升團(tuán)隊(duì)整體能力。
任職要求:
1.專業(yè)能力深度:5年以上大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),具備從0到1構(gòu)建企業(yè)級(jí)數(shù)據(jù)平臺(tái)核心模塊的成功案例,有PB級(jí)數(shù)據(jù)治理與性能調(diào)優(yōu)實(shí)戰(zhàn)經(jīng)驗(yàn)。
2.技術(shù)棧精通:精通Flink/Spark內(nèi)核,熟悉Checkpoint機(jī)制、狀態(tài)后端調(diào)優(yōu)、Exactly-Once語義;熟練使用Doris/ClickHouse/elasticsearch,掌握物化視圖、分區(qū)裁剪與查詢優(yōu)化
3.后端與云原生能力:精通Java/Scala/Python至少一種,有高并發(fā)API設(shè)計(jì)經(jīng)驗(yàn);熟悉Kubernetes部署與GPU調(diào)度,掌握容器化與彈性伸縮最佳實(shí)踐。
4.優(yōu)先條件:有信創(chuàng)項(xiàng)目國(guó)產(chǎn)化適配經(jīng)驗(yàn);在信安/內(nèi)容安全/大數(shù)據(jù)領(lǐng)域有深度實(shí)踐;有開源項(xiàng)目貢獻(xiàn)或技術(shù)社區(qū)影響力