国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 1月16日

AI大模型工程化工程師(中級(jí) / 本地部署方向)

2-4萬(wàn)
  • 太原萬(wàn)柏林區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

深度學(xué)習(xí)計(jì)算機(jī)軟件人工智能
【崗位職責(zé)】
模型蒸餾與壓縮: 負(fù)責(zé)將開(kāi)源大模型(如 DeepSeek, Llama, Qwen 等)通過(guò)蒸餾、量化(AWQ, GPTQ, GGUF)、剪枝等技術(shù),適配至公司指定的本地化硬件環(huán)境。
推理引擎開(kāi)發(fā): 負(fù)責(zé)搭建和優(yōu)化高性能本地推理后端,利用 vLLM, TensorRT-LLM 或 TGI 等框架提升并發(fā)處理能力并降低首字延遲。
私有化部署: 設(shè)計(jì)并實(shí)施大模型在私有云或邊緣計(jì)算節(jié)點(diǎn)(如 RTX 4090 集群、Mac Studio 或國(guó)產(chǎn)昇騰環(huán)境)的部署方案。
性能調(diào)優(yōu): 解決模型在本地運(yùn)行中的顯存溢出(OOM)、推理卡死、驅(qū)動(dòng)兼容性等工程問(wèn)題,持續(xù)優(yōu)化 GPU 利用率。
工程化集成: 編寫(xiě)高效的 API 接口,對(duì)接業(yè)務(wù)系統(tǒng),實(shí)現(xiàn)模型從訓(xùn)練到部署的自動(dòng)化 Pipeline。
【任職要求】
教育背景: 計(jì)算機(jī)、自動(dòng)化、數(shù)學(xué)等相關(guān)專(zhuān)業(yè)本科及以上學(xué)歷,2 年以上 AI 相關(guān)工程經(jīng)驗(yàn)。
模型經(jīng)驗(yàn): 熟悉大模型微調(diào)流程(LoRA, QLoRA),有實(shí)際的模型蒸餾或指令微調(diào)項(xiàng)目落地經(jīng)驗(yàn)者優(yōu)先。
部署方案: 深入理解 LLM 顯存占用計(jì)算原理,熟練使用 vLLM / Ollama / llama.cpp 中的至少一種進(jìn)行過(guò)生產(chǎn)級(jí)部署。
技術(shù)棧:
精通 Python 及 PyTorch 框架;
熟練掌握 Docker / NVIDIA-Docker 容器化技術(shù)及 Linux 系統(tǒng)底層運(yùn)維;
了解 CUDA 編程或 Triton 算子優(yōu)化者大加分。
硬件認(rèn)知: 對(duì) NVIDIA 顯卡架構(gòu)(如 Ada, Ampere)有清晰認(rèn)知,有國(guó)產(chǎn) AI 芯片(華為昇騰、寒武紀(jì)、海光)適配經(jīng)驗(yàn)者優(yōu)先。
解決問(wèn)題能力: 能夠獨(dú)立閱讀英文技術(shù)文檔,對(duì) Hugging Face 生態(tài)系統(tǒng)有深度使用經(jīng)驗(yàn)。
【加分項(xiàng)】
在 GitHub 上有主流推理框架或大模型微調(diào)相關(guān)貢獻(xiàn)者。
有過(guò) 70B 及以上參數(shù)量模型在有限算力下跑通推理的實(shí)戰(zhàn)案例。
熟悉分布式推理

工作地點(diǎn)

太原市-萬(wàn)柏林區(qū)-長(zhǎng)興北街萬(wàn)象城北側(cè)約200米華潤(rùn)大廈T3-3103

職位發(fā)布者

王女士/hr

立即溝通
公司Logo山西琦蘭科技有限公司
山西琦蘭科技有限公司,2013年成立以來(lái)一直專(zhuān)注于信息化領(lǐng)域的系統(tǒng)集成,致力于為客戶(hù)提供全方位、高效且定制化的解決方案。我們的業(yè)務(wù)涵蓋了軟件開(kāi)發(fā)與運(yùn)維、機(jī)房建設(shè)、信息化會(huì)議室、遠(yuǎn)程視頻會(huì)議、綜合指揮大廳、弱電綜合布線(xiàn)及室內(nèi)外監(jiān)控等多個(gè)方面。憑借多年的行業(yè)積淀和深耕,我們已在信息化領(lǐng)域取得了顯著的成績(jī),尤其是在公檢法行業(yè)中,積累了豐富的經(jīng)驗(yàn)和技術(shù)優(yōu)勢(shì)。十多年來(lái),琦蘭科技始終專(zhuān)注于公檢法領(lǐng)域的系統(tǒng)集成與服務(wù),深耕省級(jí)、市級(jí)及區(qū)縣級(jí)的公檢法系統(tǒng)建設(shè)。我們擁有一支經(jīng)驗(yàn)豐富、技術(shù)精湛的團(tuán)隊(duì),致力于為政府部門(mén)提供精確、可靠的技術(shù)支持和解決方案。在過(guò)去的十年里,我們與眾多公檢法單位緊密合作,深刻理解行業(yè)需求與痛點(diǎn),積累了寶貴的項(xiàng)目經(jīng)驗(yàn)。在A(yíng)I人工智能技術(shù)迅速發(fā)展的今天,琦蘭科技緊跟科技前沿,與上海交通大學(xué)、中科院等國(guó)內(nèi)頂尖科研院所形成了戰(zhàn)略合作伙伴關(guān)系。依托這些強(qiáng)大的技術(shù)支持,我們?cè)谛畔⒒到y(tǒng)集成的基礎(chǔ)上,融入了人工智能、大數(shù)據(jù)分析、云計(jì)算等先進(jìn)技術(shù),極大地提升了系統(tǒng)的智能化、自動(dòng)化水平,為客戶(hù)帶來(lái)了更高效、更精準(zhǔn)的技術(shù)服務(wù)。我們深知每個(gè)客戶(hù)的需求都是獨(dú)特的,因此琦蘭科技始終秉承著“以客戶(hù)為中心”的原則,提供個(gè)性化、定制化的解決方案。無(wú)論是系統(tǒng)集成、軟件開(kāi)發(fā),還是后期運(yùn)維,我們都會(huì)結(jié)合客戶(hù)的具體需求和行業(yè)特點(diǎn),量身定制最優(yōu)方案,確保每一項(xiàng)服務(wù)都能精準(zhǔn)切合客戶(hù)的實(shí)際需求。作為行業(yè)內(nèi)的先行者,琦蘭科技始終秉持著“品質(zhì)為先,技術(shù)為本”的服務(wù)理念,不斷提升自身核心競(jìng)爭(zhēng)力。我們以客戶(hù)需求為導(dǎo)向,持續(xù)優(yōu)化技術(shù)研發(fā)與服務(wù)體系,力求為每一位客戶(hù)提供最為先進(jìn)、可靠且高效的技術(shù)支持。展望未來(lái),琦蘭科技將繼續(xù)立足信息化領(lǐng)域,以創(chuàng)新為驅(qū)動(dòng)力,結(jié)合人工智能、云計(jì)算等新興技術(shù),推動(dòng)更多行業(yè)的智能化升級(jí)與轉(zhuǎn)型。
公司主頁(yè)