1. 扎實的 Java 語言基礎(chǔ),熟悉多線程、IO、網(wǎng)絡(luò)編程等核心API,具備良好的編程習(xí)慣、調(diào)試能力和單元測試意識。
2. 具備 Apache Flink 的實戰(zhàn)經(jīng)驗:必須有使用 Flink DataStream API 開發(fā)流式應(yīng)用的項目經(jīng)驗(個人/課程/實習(xí)項目均可)。理解其核心概念:時間語義(Event Time/Processing Time)、狀態(tài)(StateBackend)、窗口(Window)、檢查點(Checkpoint)和容錯機制。
3. 了解 Apache Kafka:具備一定的實際操作經(jīng)驗。理解其核心概念:Topic/Partition、Producer/Consumer/Consumer Group、Offset、副本機制。
4. 熟悉Flink與Kafka集成消費時的各種配置和調(diào)優(yōu)點。
5. 熟練掌握 Apache Doris:理解其核心數(shù)據(jù)模型(聚合模型、唯一模型、重復(fù)模型)的適用場景并能進行合理設(shè)計。具有數(shù)據(jù)導(dǎo)入的實戰(zhàn)經(jīng)驗:熟練使用Stream Load、Routine Load(尤其是來自Kafka)等方式將數(shù)據(jù)高效入庫。
6. 能夠編寫復(fù)雜SQL(如多層嵌套、窗口函數(shù)、多表JOIN)進行數(shù)據(jù)查詢和分析。理解其查詢優(yōu)化原理,對索引、分區(qū)、分桶等機制有實踐經(jīng)驗。
加分項:
1.有使用其他大數(shù)據(jù)組件(如 Pulsar、ClickHouse、Hudi)的經(jīng)驗
2.有使用調(diào)度工具(如 DolphinScheduler, Apache Airflow)的經(jīng)驗。
其他:
1. 大三、大四、研二、研三都可,實習(xí)時間至少4個月以上,每月 可接受1-2天時間請假,但不接受長時間(5天以上)請假;
2. 實習(xí)要求實習(xí)至少3個月,每周5天