任職要求:
1.計(jì)算機(jī)科學(xué)/人工智能相關(guān)專業(yè)本科及以上學(xué)歷;
2.精通Python語言,熟悉使用FastAP1、Flask、Django任一框架;
3.熟悉Linux開發(fā)環(huán)境,熟練使用Git等協(xié)作工具;
4.2年以上NLP算法開發(fā)應(yīng)用經(jīng)驗(yàn),熟悉Transformer、BERT、GPT等模型原理及調(diào)優(yōu)方法
5,熟悉大模型部署工具鏈,(Xinference/0llama/VLLM),有實(shí)際部署通義千問、DeepSeek等模型經(jīng)驗(yàn)。
6.熟悉LangChain/Dify等應(yīng)用框架,具備工作流編排與Function Caling開發(fā)經(jīng)驗(yàn)、
7.熟練使用Docker實(shí)現(xiàn)模型服務(wù)容器化,了解CI/CD流程及K8s生態(tài);、
崗位職責(zé):
1.負(fù)責(zé)大語言模型(LLM)的本地化部署、性能優(yōu)化及推理加速,熟練使用Xinference、Ollama、vLLM等框架進(jìn)行模型服務(wù)化,;確保模型在生產(chǎn)環(huán)境中的穩(wěn)定運(yùn)行和高性能表現(xiàn)
.2.基于LangChain、Dify等框架開發(fā)大模型應(yīng)用,設(shè)計(jì)并實(shí)現(xiàn)復(fù)雜工作流編排與Function
3.負(fù)責(zé)知識庫的構(gòu)建及優(yōu)化任務(wù)。