崗位職責(zé):
1. 負責(zé)設(shè)計、開發(fā)和維護高性能、可擴展的Web服務(wù)和API接口;
2. 對接機器學(xué)習(xí)、深度學(xué)習(xí)團隊,協(xié)助模型的部署與持續(xù)優(yōu)化;
3. 對現(xiàn)有的Web服務(wù)和API接口進行性能調(diào)優(yōu)和功能迭代;
4、負責(zé)容器鏡像的制作和管理,優(yōu)化鏡像大小,提高部署效率;
5、針對不同硬件平臺(如Jetson、國產(chǎn)AI芯片等)進行模型遷移和優(yōu)化,確保模型在各種平臺上的高性能運行;
4. 對模型推理性能進行持續(xù)優(yōu)化,包括但不限于模型量化、壓縮、剪枝等技術(shù)手段;
5. 與算法工程師緊密配合,共同解決模型部署和推理過程中遇到的技術(shù)難題。
6. 編寫和維護相關(guān)技術(shù)文檔,為團隊成員提供必要的技術(shù)支持;與產(chǎn)品經(jīng)理、研發(fā)工程師等其他團隊成員緊密協(xié)作,共同推動項目的進展和交付
任職要求:
1. 計算機科學(xué)、軟件工程或相關(guān)專業(yè)本科及以上學(xué)歷,3年及以上AI模型工程化或相關(guān)領(lǐng)域工作經(jīng)驗。
2. 熟練掌握Python或C++編程語言至少1種,具備良好的編碼習(xí)慣和代碼規(guī)范;
3. 掌握常見的API開發(fā)框架(flask,fastapi)等,能夠根據(jù)項目需求快速開發(fā)、調(diào)試和維護相關(guān)接口;
4. 熟悉深度學(xué)習(xí)部署框架,了解深度學(xué)習(xí)算法框架(如yolo系列、PyTorch等);
5. 熟悉Docker、Docker compose等容器化技術(shù);
6. 對AI模型優(yōu)化和多架構(gòu)適配有深入了解和實踐經(jīng)驗;
7、具備多模態(tài)大模型部署及使用相關(guān)經(jīng)驗。