1.參與海量數(shù)據(jù)分析與統(tǒng)計(jì),能夠深入分析現(xiàn)有模型不足,持續(xù)優(yōu)化算法。
2.對技術(shù)有熱情,能夠及時跟進(jìn)數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)相關(guān)技術(shù)的最前沿技術(shù)發(fā)展,并合理的運(yùn)用到實(shí)際產(chǎn)品。
3.負(fù)責(zé)公司的數(shù)據(jù)挖掘、算法設(shè)計(jì)和研發(fā)工作,通過數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法發(fā)現(xiàn)業(yè)務(wù)問題和機(jī)會點(diǎn)。
4.研究和開發(fā)基于大型語言模型(LLM)、檢索增強(qiáng)生成(RAG)和生成式人工智能(AIGC)的高級應(yīng)用
5.優(yōu)化大模型在不同業(yè)務(wù)場景下的微調(diào)和應(yīng)用,確保模型的準(zhǔn)確性和效率。
6.構(gòu)建和維護(hù)知識庫,結(jié)合RAG技術(shù),提升問答系統(tǒng)、智能助手等的性能。
7.探索并實(shí)現(xiàn)大模型在多模態(tài)、多場景下的應(yīng)用,推動通用人工智能(AGI)的發(fā)展。
8.與咨詢團(tuán)隊(duì)合作,理解并滿足定制化需求,提供端到端的大模型解決方案
1、本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、人工智能等相關(guān)專業(yè)優(yōu)先考慮。
2、熟悉大模型訓(xùn)練流程以及強(qiáng)化學(xué)習(xí)(RL)算法原理與應(yīng)用,擁有機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、推薦算法等相關(guān)領(lǐng)域的實(shí)際項(xiàng)目經(jīng)驗(yàn),能夠獨(dú)立承擔(dān)并高效完成項(xiàng)目中的算法設(shè)計(jì)與實(shí)現(xiàn)任務(wù)。
3、精通至少一種以下編程語言:R、Python、Java、Scala,具備扎實(shí)的編程功底和良好的代碼規(guī)范。同時,熟悉 Linux 開發(fā)環(huán)境,能夠熟練運(yùn)用 Linux 命令進(jìn)行項(xiàng)目開發(fā)與調(diào)試。
4、熟悉 Hive、Spark 等大數(shù)據(jù)處理技術(shù),能夠運(yùn)用這些技術(shù)高效處理和分析大規(guī)模數(shù)據(jù)。有機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等系統(tǒng)的搭建與實(shí)施經(jīng)驗(yàn),能夠獨(dú)立完成系統(tǒng)的架構(gòu)設(shè)計(jì)、開發(fā)與部署工作。
5、對大型語言模型、檢索增強(qiáng)生成(RAG)和人工智能生成內(nèi)容(AIGC)有深入理解,具備相關(guān)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
6、熟練掌握至少一種主流深度學(xué)習(xí)框架,如 TensorFlow 或 PyTorch,能夠利用框架快速搭建、訓(xùn)練和優(yōu)化深度學(xué)習(xí)模型。具備使用框架進(jìn)行模型調(diào)優(yōu)、超參數(shù)調(diào)整的實(shí)際經(jīng)驗(yàn),能通過實(shí)驗(yàn)和分析不斷提升模型性能,有效解決模型過擬合、欠擬合等問題。
7、擁有將人工智能模型部署到實(shí)際生產(chǎn)環(huán)境的經(jīng)驗(yàn),熟悉模型部署的常見平臺和工具,如 Docker、Kubernetes 等。能夠根據(jù)實(shí)際業(yè)務(wù)需求對模型進(jìn)行性能優(yōu)化,包括但不限于模型壓縮、量化等操作,確保模型在資源受限的環(huán)境下也能高效運(yùn)行,滿足業(yè)務(wù)對實(shí)時性和準(zhǔn)確性的要求。