崗位職責
在太初架構(gòu)上建設和優(yōu)化 Triton 編譯器,提升 AI 計算的性能和效率。
1. 在太初AI架構(gòu)上適配和優(yōu)化 Triton 編譯器;
2. 基于 MLIR + Linalg 框架,提升編譯器代碼執(zhí)行效率;
3. 參與 圖優(yōu)化、后端代碼生成、調(diào)度策略、指令優(yōu)化、流水并行化 相關(guān)優(yōu)化工作;
4. 研究和優(yōu)化 Kernel 計算性能,降低計算開銷,提高吞吐率;
5. 研究算子融合(Op Fusion)、自動調(diào)優(yōu)(Auto-Tuning)、代碼生成(CodeGen) 相關(guān)優(yōu)化策略;
6. 與 硬件團隊、AI框架團隊(如 PyTorch) 協(xié)作,提升AI編譯器的支持能力;
7. 跟蹤 LLVM、Triton、TVM、XLA、TorchInductor 等 AI 編譯器前沿技術(shù),優(yōu)化編譯性能。
任職資格
1.優(yōu)秀的學習能力,對 AI 編譯器、AI計算優(yōu)化有濃厚興趣;
2.熟悉 C++/Python,具備編譯器或 AI 編譯優(yōu)化開發(fā)經(jīng)驗,熟悉 Triton 編譯流程;
3.熟悉 MLIR、Linalg等基礎設施;
4.具備ai編譯優(yōu)化(如 TVM、XLA、TorchInductor) 經(jīng)驗者優(yōu)先;
5.熟悉 Kernel 計算優(yōu)化、算子融合、自動并行化等高性能計算優(yōu)化策略者加分。
加分項(優(yōu)先考慮)
1.參與過 Triton、MLIR、IREE、XLA、TVM、TorchInductor 等編譯器的開發(fā),或在 GitHub 提交過相關(guān) PR
2.具備MLU/NPU/GPU 相關(guān)的編譯優(yōu)化經(jīng)驗。