崗位職責(zé)
1、負(fù)責(zé)垂類大模型的架構(gòu)設(shè)計(jì)與開(kāi)發(fā),優(yōu)化模型訓(xùn)練效率及性能,解決高并發(fā)、分布式訓(xùn)練等技術(shù)挑戰(zhàn);
2、基于業(yè)務(wù)場(chǎng)景設(shè)計(jì)強(qiáng)化學(xué)習(xí)技術(shù)方案,推動(dòng)大模型在實(shí)驗(yàn)室領(lǐng)域的實(shí)際應(yīng)用落地;
3、主導(dǎo)模型預(yù)訓(xùn)練、微調(diào)及強(qiáng)化學(xué)習(xí)策略(如PPO、DQN等)的工程實(shí)現(xiàn),提升模型在垂直場(chǎng)景的效果;
4、探索前沿技術(shù)(如模型壓縮、多模態(tài)融合),優(yōu)化資源利用率并降低推理成本;
5、與應(yīng)用領(lǐng)域?qū)<覅f(xié)作,將業(yè)務(wù)需求轉(zhuǎn)化為技術(shù)方案,確保模型與應(yīng)用場(chǎng)景深度適配。
任職要求
1、計(jì)算機(jī)科學(xué)或相關(guān)領(lǐng)域的本科及以上學(xué)歷,三年以上工作經(jīng)驗(yàn)。
2、熟悉主流大模型架構(gòu)(如Transformer、BERT、GPT、T5等)及其變體。
3、有深度學(xué)習(xí)模型部署和優(yōu)化經(jīng)驗(yàn),精通PyTorch、TensorFlow等深度學(xué)習(xí)框架。
4、熟悉經(jīng)典視覺(jué)模型(如ResNet、YOLO、UNet、ViT等)及其應(yīng)用場(chǎng)景,熟悉OpenCV、CUDA、TensorRT等工具。
5、具有垂直場(chǎng)景落地實(shí)踐經(jīng)驗(yàn),了解大模型應(yīng)用開(kāi)發(fā)(如基于GPT API的場(chǎng)景適配
)者優(yōu)先。