職位描述
崗位職責:
1、負責端側模型推理框架開發(fā),包括模型壓縮、優(yōu)化技術,在端側的接入、適配、算子開發(fā)工作,使之符合業(yè)務要求,提高性能收益;
2、負責探索和落地 AI 模型工程部署前沿技術,包括但不限于稀疏計算、編譯優(yōu)化。
任職要求:
1、具備扎實的計算機科學功底和編程能力,了解常見并行計算算法,具有良好的編程習慣;
2、熟悉transformers、stable diffusion等主流模型原理;
3、良好的團隊協(xié)作能力;
4、創(chuàng)新性強,有良好的動手實現(xiàn)能力,對技術有熱情;
5、加分項:了解模型剪枝、量化等優(yōu)化方法原理,具備相關模型優(yōu)化經(jīng)驗。