国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月28日

大模型應(yīng)用算法工程師

1.2-1.8萬(wàn)
  • 深圳南山區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

深度學(xué)習(xí)機(jī)器學(xué)習(xí)圖像算法CLIP云計(jì)算/大數(shù)據(jù)計(jì)算機(jī)軟件人工智能
  1. 前沿模型選型與微調(diào)
    針對(duì)業(yè)務(wù)場(chǎng)景評(píng)估LLaMA/Qwen等開源或商用大模型的優(yōu)缺點(diǎn),完成全參、LoRA、QLoRA、RLHF、DPO 等微調(diào),使模型在垂直領(lǐng)域達(dá)到上線精度
    。
  2. 數(shù)據(jù)工程與知識(shí)庫(kù)構(gòu)建
    負(fù)責(zé)海量文本/多模態(tài)數(shù)據(jù)的采集、清洗、去重、配比、指令構(gòu)造、質(zhì)量評(píng)估,并建立可更新版本的知識(shí)庫(kù)或向量索引,為 RAG、Agent 提供檢索底座
    。
  3. 模型壓縮與推理加速
    應(yīng)用量化、剪枝、蒸餾、Flash-Attention、vLLM、TensorRT-LLM、Triton 等方案,在 GPU/昇騰/NPU 上實(shí)現(xiàn) 2-10× 推理加速與顯存壓縮,滿足線上低延遲、高并發(fā)要求
    。
  4. 應(yīng)用框架與智能體開發(fā)
    基于 LangChain、LlamaIndex、Dify、Coze、AutoGPT 等搭建 Agent,完成多輪對(duì)話、工具調(diào)用 (Tool Calling)、任務(wù)規(guī)劃、意圖路由、工作流編排,實(shí)現(xiàn)復(fù)雜業(yè)務(wù)自動(dòng)化
  5. 高性能服務(wù)化與部署
    使用 Python/FastAPI/Tornado 開發(fā)異步推理服務(wù),封裝 REST/gRPC 接口;用 Docker+K8s+Helm 做容器化編排,實(shí)現(xiàn)灰度發(fā)布、彈性伸縮、負(fù)載均衡與可觀測(cè)性
    。
  6. 存儲(chǔ)與檢索系統(tǒng)
    設(shè)計(jì) PostgreSQL、Redis、Milvus/Elasticsearch 等混合存儲(chǔ)方案,支持結(jié)構(gòu)化元數(shù)據(jù)、緩存、向量檢索與關(guān)鍵詞檢索,提高多路召回效率
    。
  7. 性能監(jiān)控與持續(xù)優(yōu)化
    構(gòu)建線上指標(biāo)體系(QPS、Latency、TTFT、TP99、吞吐、GPU 利用率),定位瓶頸并迭代優(yōu)化;通過 A/B 實(shí)驗(yàn)驗(yàn)證業(yè)務(wù)效果(準(zhǔn)確率、轉(zhuǎn)化率、用戶滿意度)
    。
  8. 技術(shù)跟蹤與內(nèi)部賦能
    持續(xù)閱讀頂會(huì)論文(NeurIPS、ICML、ACL、EMNLP)、跟蹤開源社區(qū)動(dòng)態(tài),定期輸出技術(shù)報(bào)告與最佳實(shí)踐,推動(dòng)團(tuán)隊(duì)技術(shù)升級(jí)與知識(shí)共享

工作地點(diǎn)

深圳南山區(qū)曙光大廈12樓12號(hào)

職位發(fā)布者

何世聰/人事經(jīng)理

昨日活躍
立即溝通