国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 8月27日

大模型計(jì)算優(yōu)化工程師

2.5-5萬(wàn)·15薪
  • 南京江寧區(qū)
  • 3-5年
  • 碩士
  • 全職
  • 招5人

職位描述

CUDA編程TRITON編程人工智能
核心職責(zé):
研究并實(shí)現(xiàn)前沿的模型量化技術(shù)(包括但不限于A(yíng)WQ、GPTQ、QAT),推動(dòng)其在生產(chǎn)環(huán)境中的落地。
探索投機(jī)推理(Speculative Decoding)、剪枝、稀疏化等高級(jí)優(yōu)化技術(shù),并將其集成至推理引擎。
通過(guò)CUDA與Triton編程,為優(yōu)化后的大模型開(kāi)發(fā)高性能定制算子與計(jì)算內(nèi)核。
與AI編譯器團(tuán)隊(duì)緊密協(xié)作,設(shè)計(jì)和實(shí)現(xiàn)計(jì)算圖優(yōu)化、內(nèi)核自動(dòng)生成與融合策略。
為分布式推理系統(tǒng)提供底層的通信與計(jì)算優(yōu)化支持,解決性能瓶頸。
必備要求:
計(jì)算機(jī)、電子工程相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷。
扎實(shí)的基礎(chǔ)技能:精通C++/CUDA,深入理解計(jì)算機(jī)體系結(jié)構(gòu)、并行計(jì)算。
深厚的CUDA編程與調(diào)試能力,有高性能計(jì)算內(nèi)核開(kāi)發(fā)經(jīng)驗(yàn)。
熟悉大模型推理系統(tǒng)的底層計(jì)算流程與性能特性。
對(duì)模型量化(PTQ/QAT)的基本原理有深刻理解,并有實(shí)踐項(xiàng)目經(jīng)驗(yàn)。
優(yōu)先考慮:
擁有Triton編程經(jīng)驗(yàn),能夠高效開(kāi)發(fā)與調(diào)試GPU內(nèi)核。
在投機(jī)推理、剪枝、稀疏化等任一領(lǐng)域有實(shí)際的項(xiàng)目經(jīng)驗(yàn)或深入理解。
有AI編譯器(TVM, MLIR, IREE)開(kāi)發(fā)或深度使用經(jīng)驗(yàn)。
熟悉AWQ、GPTQ等訓(xùn)練后量化算法的原理與實(shí)現(xiàn)細(xì)節(jié)。

工作地點(diǎn)

南京江寧區(qū)天泉路168號(hào)

職位發(fā)布者

張婕/自主智能系統(tǒng)團(tuán)隊(duì)

昨日活躍
立即溝通
中科工業(yè)人工智能研究院
中科工業(yè)人工智能研究院(簡(jiǎn)稱(chēng)“智能研究院”)位于江蘇省南京市,以人工智能和制造業(yè)深度融合為主線(xiàn),培育發(fā)展新質(zhì)生產(chǎn)力,致力于成為我國(guó)智能制造領(lǐng)域的領(lǐng)軍科研機(jī)構(gòu)和原始創(chuàng)新策源地、產(chǎn)業(yè)技術(shù)輻射源?,F(xiàn)誠(chéng)摯邀請(qǐng)優(yōu)秀人才加入智能研究院,共同探索智能制造的未來(lái)!
公司主頁(yè)