崗位職責(zé):
1、 數(shù)據(jù)存儲(chǔ)與研發(fā)
設(shè)計(jì)并優(yōu)化分布式數(shù)據(jù)存儲(chǔ)方案(如HDFS,ES等),支撐茶壽健康數(shù)據(jù)的底層數(shù)據(jù)存儲(chǔ)。
搭建和維護(hù)實(shí)時(shí)/離線數(shù)據(jù)管道(如Kafka/Hadoop/Spark),保障數(shù)據(jù)低延遲、高吞吐處理;
構(gòu)建和維護(hù)數(shù)據(jù)倉(cāng)庫(kù)、ETL管道,確保數(shù)據(jù)高效存儲(chǔ)和訪問;
2、數(shù)據(jù)抓取與安全
開發(fā)自動(dòng)化爬蟲系統(tǒng),抓取公開健康數(shù)據(jù)(如臨床指南、藥品庫(kù)、運(yùn)動(dòng)營(yíng)養(yǎng)數(shù)據(jù)),確保數(shù)據(jù)質(zhì)量與合規(guī)性;
制定數(shù)據(jù)安全標(biāo)準(zhǔn)與脫敏規(guī)則,滿足醫(yī)療健康行業(yè)隱私要求(如HIPAA、GDPR);
3、 數(shù)據(jù)解析與分析
對(duì)健康相關(guān)數(shù)據(jù)(如用戶體征數(shù)據(jù)、運(yùn)動(dòng)記錄、醫(yī)療信息等)進(jìn)行結(jié)構(gòu)化解析和標(biāo)準(zhǔn)化處理;
通過統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等方法挖掘數(shù)據(jù)價(jià)值,支持健康風(fēng)險(xiǎn)評(píng)估、用戶行為分析等場(chǎng)景;
4、 BI系統(tǒng)與數(shù)據(jù)服務(wù)
基于業(yè)務(wù)需求開發(fā)BI看板(如Superset/Tableau/Power BI),可視化健康指標(biāo)(如用戶活躍度、慢病管理效果);
提供標(biāo)準(zhǔn)化數(shù)據(jù)API,支持運(yùn)營(yíng)、產(chǎn)品團(tuán)隊(duì)自助分析;
5、跨團(tuán)隊(duì)協(xié)作
與產(chǎn)品、算法、臨床團(tuán)隊(duì)合作,理解業(yè)務(wù)需求,推動(dòng)數(shù)據(jù)驅(qū)動(dòng)的健康管理方案落地;
6、完成領(lǐng)導(dǎo)交辦的相關(guān)工作。
任職要求:
1、1年以上數(shù)據(jù)開發(fā)經(jīng)驗(yàn),精通大數(shù)據(jù)技術(shù)棧(Hadoop/Spark/Flink/Kafka等);
2、熟練使用Python/Go,掌握SQL優(yōu)化與分布式計(jì)算(如Hive/Presto);
3、熟悉數(shù)據(jù)倉(cāng)庫(kù)建模(維度建模、數(shù)據(jù)分層)及OLAP引擎(ClickHouse/Doris);
4、有BI工具開發(fā)經(jīng)驗(yàn)(如Tableau/Superset),能獨(dú)立設(shè)計(jì)數(shù)據(jù)可視化方案。