崗位要求:
1、碩士及以上學(xué)歷,計算機、人工智能等相關(guān)專業(yè)畢業(yè);
2、實驗?zāi)芰?可快速復(fù)現(xiàn)前沿技術(shù)并評估可行性)、實戰(zhàn)能力強(技術(shù)方案通過可行性評估后,具備獨立封裝算法模型的能力);
3、精通Python、C/C++(可選)等編程語言,熟練掌握PyTorch等主流深度學(xué)習(xí)框架,Transformers、Vlm等;
4、熟悉大模型分布式訓(xùn)練技術(shù)和框架庫,如DeepSpeed等,熟悉框架庫源碼,有多卡或多機的大模型訓(xùn)練經(jīng)驗;
5、熟悉知識圖譜相關(guān)技術(shù)原因、圖數(shù)據(jù)等技術(shù);
6、精通大模型推理優(yōu)化技術(shù)、精通各種微調(diào)技術(shù),如LORA、QLORA、SFT、DPO等。
崗位職責(zé):
1、負責(zé)大模型相關(guān)場景的工程化落地,探索業(yè)界先進的大模型(及架構(gòu))、Agent技術(shù)/框架、前沿RAG技術(shù)等;
2、圍繞大模型(包括多模態(tài))領(lǐng)域,構(gòu)建從數(shù)據(jù)采集、加工標(biāo)注、算法訓(xùn)練部署至推理加速等;
3、負責(zé)大模型的結(jié)構(gòu)設(shè)計、訓(xùn)練、微調(diào)、部署和優(yōu)化,提高模型的效率、穩(wěn)定性和可擴展性;
4、跟蹤國內(nèi)外前沿的大模型技術(shù)動態(tài),持續(xù)改進和優(yōu)化現(xiàn)有模型;
5、負責(zé)知識圖譜(知識及index)全自動化構(gòu)建,全流程(抽取、融合、消歧等)優(yōu)化等。