一、崗位職責(zé)
模型研發(fā)與優(yōu)化:基于 Python 深度參與深度學(xué)習(xí)模型調(diào)優(yōu),熟練掌握決策樹,隨機(jī)森林,神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法及衍生算法在金融場(chǎng)景的應(yīng)用;
有大模型研發(fā)經(jīng)驗(yàn)者,可主導(dǎo)或協(xié)同探索模型與策略的融合創(chuàng)新。
數(shù)據(jù)處理與分析:運(yùn)用 Hadoop 分布式存儲(chǔ)管理海量金融數(shù)據(jù),通過 Hive/Spark 構(gòu)建高效數(shù)倉(cāng);憑借豐富 SQL 調(diào)優(yōu)經(jīng)驗(yàn),保障數(shù)據(jù)查詢、特征工程環(huán)節(jié)的性能,為模型訓(xùn)練輸送高質(zhì)量數(shù)據(jù)。
產(chǎn)線全流程落地:負(fù)責(zé)算法模型從研發(fā)到產(chǎn)線的轉(zhuǎn)化,涵蓋開發(fā)、驗(yàn)證、優(yōu)化及長(zhǎng)期維護(hù)
二、任職要求
編程語言:精通 Python,熟練運(yùn)用 Pandas、NumPy 等數(shù)據(jù)處理庫(kù),掌握 Sklearn、TensorFlow/PyTorch 等機(jī)器學(xué)習(xí)框架 。
大數(shù)據(jù)生態(tài):熟悉 Hadoop 分布式存儲(chǔ)原理,熟練操作 Hive 數(shù)據(jù)倉(cāng)庫(kù)建模、Spark 大數(shù)據(jù)計(jì)算,能高效處理 TB 級(jí)數(shù)據(jù)。
數(shù)據(jù)庫(kù)與調(diào)優(yōu):精通 SQL,擅長(zhǎng)索引優(yōu)化、查詢計(jì)劃分析,能解決金融場(chǎng)景下高并發(fā)、復(fù)雜查詢的性能瓶頸。
模型經(jīng)驗(yàn):有深度學(xué)習(xí)模型調(diào)優(yōu)實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉決策樹、隨機(jī)森林、XGBoost 等算法;參與過大模型研發(fā)優(yōu)先。