【崗位職責(zé)】
1、本地化部署與適配,負(fù)責(zé)將AI模型部署到本地服務(wù)器、邊緣設(shè)備或私有化環(huán)境中,確保與硬件、操作系統(tǒng)兼容。
2、持續(xù)迭代與部署,與團(tuán)隊(duì)協(xié)作優(yōu)化模型推理性能(如模型輕量化、硬件適配),確保訓(xùn)練模型可落地。 監(jiān)控線上模型表現(xiàn),根據(jù)反饋數(shù)據(jù)持續(xù)迭代模型版本,優(yōu)化提升各項(xiàng)指標(biāo)。
3、性能優(yōu)化與資源管理,對(duì)部署后的模型進(jìn)行性能調(diào)優(yōu)(如推理速度、內(nèi)存占用、能耗優(yōu)化)。
4、管理計(jì)算資源(GPU/CPU)、存儲(chǔ)資源,確保系統(tǒng)高效穩(wěn)定運(yùn)行。
5、系統(tǒng)維護(hù)與監(jiān)控,搭建監(jiān)控體系,實(shí)時(shí)跟蹤模型運(yùn)行狀態(tài)、資源消耗和異常情況。
制定容災(zāi)和備份方案,保障系統(tǒng)高效率的可用性。
6、跨團(tuán)隊(duì)協(xié)作,與算法工程師、產(chǎn)品經(jīng)理協(xié)作,理解業(yè)務(wù)需求并提供部署支持。
7、配合安全團(tuán)隊(duì)確保數(shù)據(jù)隱私和系統(tǒng)安全性(如加密、訪問控制)。
任職資格:
1、教育背景:計(jì)算機(jī)科學(xué)、軟件工程、電子信息等相關(guān)專業(yè)本科及以上學(xué)歷。
2、技術(shù)能力: 熟悉深度學(xué)習(xí)框架(TensorFlow/PyTorch等)的模型導(dǎo)出與部署流程。 精通Linux系統(tǒng)、Docker容器化技術(shù),熟悉Kubernetes集群管理。 了解硬件加速技術(shù)(如CUDA、TensorRT、OpenVINO)。 掌握至少一門腳本語言(Python/Shell)和系統(tǒng)級(jí)語言(C++/Java)。
3、項(xiàng)目經(jīng)驗(yàn):有AI模型本地化部署經(jīng)驗(yàn),熟悉邊緣計(jì)算或私有云環(huán)境。 熟悉主流部署工具(如ONNX、Triton Inference Server)。
4、邏輯思維:能通過科學(xué)實(shí)驗(yàn)設(shè)計(jì)驗(yàn)證假設(shè),具備數(shù)據(jù)驅(qū)動(dòng)的問題解決能力。
5、溝通協(xié)作:與產(chǎn)品、數(shù)據(jù)、工程團(tuán)隊(duì)高效協(xié)同,清晰傳遞技術(shù)方案。
6、學(xué)習(xí)能力:持續(xù)跟蹤AI領(lǐng)域技術(shù)進(jìn)展,快速吸收并應(yīng)用到業(yè)務(wù)中。
7、要求:1-3年模型訓(xùn)練經(jīng)驗(yàn),能獨(dú)立完成數(shù)據(jù)到模型的Pipeline搭建。
【福利待遇】
1.餐補(bǔ)及全勤獎(jiǎng),工作滿一年有工齡獎(jiǎng);
2.周末雙休、法律規(guī)定的公休假日及帶薪年假;
3.入職繳納社保,青島北站至公司免費(fèi)往返班車;
4.節(jié)日生日福利、員工旅游、出國參展學(xué)習(xí)機(jī)會(huì);
5.釋放能力的平臺(tái),帶薪培訓(xùn),晉升空間廣闊。