崗位職責:
1、開發(fā)大模型在各種應用場景中的應用,重點關注人機交互方面;負責語言大模型/多模態(tài)大模型的分析和性能調(diào)優(yōu)
2、深入理解業(yè)務,進行重點難點技術攻關工作,將技術實現(xiàn)與業(yè)務場景聯(lián)系起來,快速解決業(yè)務需求問題。
3、研究最新的自然語言處理算法,并將其應用到我們的系統(tǒng)中,提高平臺的性能和競爭力;
4、負責算法的性能測試和調(diào)優(yōu)、Prompt設計、對預訓練模型的分布式、加速訓練及模型蒸餾、部署,保證算法的準確性和效率;與團隊合作,不斷改進和優(yōu)化算法,推動平臺技術的發(fā)展。
5、負責大語言模型的訓練、對齊、調(diào)優(yōu)以及下游應用落地等相關工作,對大模型進行預訓練、微調(diào)、服務化等,對接業(yè)務需求,針對具體方向,提高準確性和可用性
任職資格:
1、計算機科學、人工智能相關專業(yè)碩士及以上學歷,具備從事NLP、大語言模型(LLM)預訓練算法研究、基礎大模型訓練經(jīng)驗(科研、工作經(jīng)驗均可);
2、熟悉LLM大模型基本原理及應用、Langchain框架及應用,有GPT大模型研發(fā)經(jīng)驗者優(yōu)先。
3、深入掌握機器學習和深度學習,熟悉Tensorflow/PyTorch框架,熟練掌握GPT/Llama /BERT/Transformer框架;
4、熟悉Linux系統(tǒng),熟練使用Python語言進行開發(fā),數(shù)學理論基礎扎實,編程實現(xiàn)能力高效;
5、有良好的溝通表達能力,積極向上,細致認真。