核心職責(zé) (Key Responsibilities)
1. 智能體(AI Agent)開發(fā)與構(gòu)建
基于主流大模型開發(fā)能夠自主規(guī)劃、調(diào)用工具、記憶上下文的智能體(Agent)。
設(shè)計(jì)并實(shí)現(xiàn)RAG(檢索增強(qiáng)生成)架構(gòu),結(jié)合向量數(shù)據(jù)庫優(yōu)化私有知識(shí)庫的問答與交互體驗(yàn)。
設(shè)計(jì)Prompt Engineering(提示詞工程)及Agent的工作流(Workflow),提升模型在復(fù)雜任務(wù)中的推理與執(zhí)行成功率。
2. 領(lǐng)域?qū)S媚P陀?xùn)練(圖像與聲學(xué))
圖像識(shí)別: 針對(duì)特定業(yè)務(wù)場景(如工業(yè)缺陷檢測、場景分析、人臉/行為識(shí)別等),收集數(shù)據(jù)并獨(dú)立進(jìn)行CV模型的選型、訓(xùn)練、微調(diào)(Fine-tuning)與評(píng)估。
聲學(xué)/語音識(shí)別: 負(fù)責(zé)特定領(lǐng)域的聲紋識(shí)別、異常聲音檢測或語音指令識(shí)別(ASR)模型的訓(xùn)練與優(yōu)化。
負(fù)責(zé)從數(shù)據(jù)清洗、標(biāo)注、增強(qiáng)到模型訓(xùn)練及轉(zhuǎn)化的全流程。
3. 工程落地與優(yōu)化
將訓(xùn)練好的模型(CV/Audio)與Agent邏輯進(jìn)行端到端整合,封裝為高可用的API或SDK。
負(fù)責(zé)模型在服務(wù)器端或邊緣設(shè)備(Edge Device)上的推理加速與部署(如使用TensorRT, ONNX Runtime等)。
持續(xù)跟蹤AI領(lǐng)域的最新論文與技術(shù)(如Multimodal LLMs),并進(jìn)行復(fù)現(xiàn)與技術(shù)轉(zhuǎn)化。
任職要求 (Job Requirements)
1. 學(xué)歷要求
計(jì)算機(jī)科學(xué)、人工智能、電子工程或相關(guān)專業(yè)本科及以上學(xué)歷。
2. 大模型與Agent技能
精通 Python 編程,熟悉 LangChain, LlamaIndex, AutoGPT 或類似Agent開發(fā)框架。
深入理解Transformer架構(gòu),熟悉主流LLM的API調(diào)用、Function Calling及Fine-tuning(如LoRA, P-Tuning)技術(shù)。
熟悉向量數(shù)據(jù)庫(如Milvus, Faiss, Pinecone)的使用與調(diào)優(yōu)。
3. 深度學(xué)習(xí)與模型訓(xùn)練技能
框架熟練度: 熟練掌握 PyTorch 或 TensorFlow 深度學(xué)習(xí)框架。
視覺算法: 熟悉主流CV網(wǎng)絡(luò)架構(gòu)(如ResNet, YOLO系列, Vision Transformers),有目標(biāo)檢測、圖像分類或分割的實(shí)際訓(xùn)練經(jīng)驗(yàn)。
聲學(xué)算法: 了解音頻信號(hào)處理(時(shí)頻分析、梅爾頻譜等),熟悉音頻分類或語音識(shí)別模型(如Wav2Vec, HuBERT, Whisper, Conformer等)。
4. 綜合素質(zhì)
具備良好的英文論文閱讀能力,能快速復(fù)現(xiàn)前沿算法。
具備優(yōu)秀的問題拆解能力,能夠獨(dú)立完成“數(shù)據(jù)-模型-應(yīng)用”的閉環(huán)。
加分項(xiàng) (Preferred Qualifications)
多模態(tài)大模型經(jīng)驗(yàn): 熟悉LLaVA, GPT-4V等視覺-語言模型(VLM)的微調(diào)或應(yīng)用者優(yōu)先。
邊緣計(jì)算經(jīng)驗(yàn): 有將模型部署在NVIDIA Jetson、樹莓派或移動(dòng)端設(shè)備的經(jīng)驗(yàn)者優(yōu)先。
全棧能力: 具備后端開發(fā)能力(FastAPI/Flask/Django),能獨(dú)立交付Demo者優(yōu)先。
注意:該崗位要求實(shí)習(xí)時(shí)間最少4個(gè)月,不滿足者勿投!