base:杭州或者上海都可以
Python工程師(算法工程化)
崗位職責
模型服務化部署:負責將算法工程師研發(fā)的機器學習 / 深度學習模型轉(zhuǎn)化為高效、穩(wěn)定、可擴展的線上服務(如 RESTful API、gRPC 服務等),確保服務高可用、低延遲。
服務架構設計:設計高并發(fā)、高可靠的服務端架構,優(yōu)化資源利用率,支持模型推理、數(shù)據(jù)預處理、結果緩存等流程。
性能調(diào)優(yōu):持續(xù)優(yōu)化服務端性能(如響應時間、吞吐量、資源占用率),提升模型推理效率,降低服務成本。
系統(tǒng)維護與監(jiān)控:搭建服務監(jiān)控體系(日志、指標、告警),保障線上服務穩(wěn)定性;快速定位并解決服務異常、性能瓶頸等問題。
協(xié)作對接:與算法工程師、客戶端開發(fā)、運維團隊緊密配合,確保模型迭代與業(yè)務需求無縫銜接。
崗位要求
硬性條件
經(jīng)驗:3 年以上服務端開發(fā)經(jīng)驗,有機器學習模型部署經(jīng)驗者優(yōu)先(TensorFlow Serving、TorchServe、Triton 等框架)。
技術棧:
精通 Python/Go/Java 至少一種語言,熟悉 Flask/Django/Gin/Spring 等框架;
熟悉分布式系統(tǒng)、微服務架構(如 gRPC、Kafka、Redis)、容器化技術(Docker/K8s);
掌握模型部署工具鏈(ONNX、TensorRT、模型量化 / 壓縮等)。
云平臺:熟悉 AWS、阿里云等云服務,具備服務高可用設計、彈性擴縮容經(jīng)驗。
加分項
熟悉模型推理性能優(yōu)化(GPU/CPU 資源調(diào)度、并行計算、顯存管理);
了解 CI/CD、自動化測試流程(Jenkins/GitLab CI);
有大規(guī)模數(shù)據(jù)處理(Spark/Flink)或?qū)崟r服務開發(fā)經(jīng)驗。