職位描述:
1. 參與基礎(chǔ)大模型和端側(cè)大模型的研發(fā)工作,包括架構(gòu)設(shè)計、預(yù)訓(xùn)練、后訓(xùn)練等,端到端構(gòu)建通用大模型;
2. 負責(zé)大模型高階能力(Coding、Agent等)的專項提升,打造模型長版特性;
3. 持續(xù)關(guān)注大模型最新研究,探索下一代大模型的架構(gòu)和訓(xùn)練方法,做出有影響力的成果;
職位要求:
1. 碩士及以上學(xué)歷,計算機科學(xué)、人工智能等相關(guān)專業(yè);
2. 熟悉深度學(xué)習(xí)框架(例如pytorch等),具備大模型和端側(cè)大模型的算法開發(fā)經(jīng)驗,具備數(shù)據(jù)處理、模型架構(gòu)設(shè)計、大規(guī)模訓(xùn)練等經(jīng)驗;
3. 對大模型架構(gòu)、訓(xùn)練、數(shù)據(jù)、系統(tǒng)優(yōu)化中的某一方面有深入理解,以下符合1條以上:
- 能夠提出創(chuàng)新性的大模型架構(gòu)和端側(cè)大模型架構(gòu),探索技術(shù)的下一跳;
- 熟練掌握強化學(xué)習(xí)(RL)和模型微調(diào)(SFT)等后訓(xùn)練技術(shù),并可以提出創(chuàng)新的后訓(xùn)練方法;
- 對coding、math、agent等大模型高階能力有深入思考;
- 熟練掌握大模型預(yù)訓(xùn)練的Know How,可以快速診斷并修復(fù)問題,提升模型能力;
- 對預(yù)訓(xùn)練數(shù)據(jù)、后訓(xùn)練數(shù)據(jù)的生產(chǎn)、合成方法有深入理解;
- 熟練模型訓(xùn)練/推理的系統(tǒng)優(yōu)化方法,提升模型的實際訓(xùn)練、推理性能;
4. 有大模型/端側(cè)大模型架構(gòu)、訓(xùn)練、數(shù)據(jù)、系統(tǒng)優(yōu)化等相關(guān)實戰(zhàn)經(jīng)驗者優(yōu)先,在NeurIPS/ICML/ICLR/ACL/EMNLP/CVPR/ICCV/TPAMI等AI頂會發(fā)表過相關(guān)論文者優(yōu)先;
公司介紹:
三星電子中國研究院是三星電子在華投資設(shè)立的具有獨立法人資格的研發(fā)機構(gòu),是具備博士后工作站運營資質(zhì)、聚集了600人研發(fā)團隊,并由國家批準認定的軟件企業(yè)。研究院專注于人工智能、5G/6G通信技術(shù)研究和標準化等前沿技術(shù),也積極進行商用化的開發(fā)、推動先進技術(shù)在三星產(chǎn)品中的商用化落地,提升三星電子產(chǎn)品的競爭力。
新時代,新機遇。三星電子中國研究院希望把握人工智能、5G/6G與IoT技術(shù)發(fā)展的時代機遇,凝聚海內(nèi)外計算機、電子及通信領(lǐng)域的優(yōu)秀人才,堅守“做中國人民喜愛的企業(yè),貢獻于中國社會的企業(yè)”的承諾,與您一起攜手共贏、創(chuàng)造未來! 真誠歡迎您的加入!
※ 請應(yīng)聘者在應(yīng)聘過程中對現(xiàn)公司、 前公司的商業(yè)秘密進行保密
※ 請應(yīng)聘者確認您投遞的簡歷不包含現(xiàn)公司、前公司的商業(yè)秘密