崗位職責(zé):
1、負(fù)責(zé)LLM/AIGC模型工程化,包括大模型訓(xùn)練和推理AI Infra,并行加速并部署AIGC模型,適配GPU資源;
2、負(fù)責(zé)音視頻相關(guān)算法的AI服務(wù)上線,與算法團(tuán)隊(duì)深度合作,深入研究Java微服務(wù)相關(guān)技術(shù),如Spring Cloud、Docker、Kubernetes等;
3、設(shè)計(jì)和實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的處理流程pipeline,提高數(shù)據(jù)處理效率和CPU/GPU資源利用率;
4、負(fù)責(zé)公司AI后臺(tái)技術(shù)架構(gòu),確保技術(shù)選型與業(yè)務(wù)發(fā)展的匹配度;確保技術(shù)架構(gòu)的前瞻性和可擴(kuò)展性;
5、主導(dǎo)DevOps實(shí)踐,包括自動(dòng)化部署、持續(xù)集成/持續(xù)部署(CI/CD)、監(jiān)控與告警等;
任職要求:
1、至少1年以上微服務(wù)架構(gòu)或者AI工程化部署經(jīng)驗(yàn);精通Python/Java/Golang及微服務(wù)、AI Infra相關(guān)技術(shù);
2、熟悉DevOps文化和技術(shù)棧,有使用Docker、Kubernetes等容器化技術(shù)的實(shí)際經(jīng)驗(yàn);
3、對(duì)分布式系統(tǒng)、高并發(fā)、微服務(wù)治理、服務(wù)化架構(gòu)等有深入理解;
4、熟悉常用的中間件技術(shù),如MySQL、NoSQL、RabbitMQ、Kafka、Nginx、Openresty等;
5、綜合能力:
5.1、具備良好的系統(tǒng)設(shè)計(jì)和架構(gòu)能力,能夠獨(dú)立完成復(fù)雜系統(tǒng)的架構(gòu)設(shè)計(jì);
5.2、具有較強(qiáng)的學(xué)習(xí)能力和團(tuán)隊(duì)合作精神,能夠適應(yīng)快速變化的技術(shù)環(huán)境;
5.3、有大型項(xiàng)目或互聯(lián)網(wǎng)公司技術(shù)架構(gòu)經(jīng)驗(yàn)者優(yōu)先;