- 專業(yè)方向:計算機科學(xué)、人工智能、機器學(xué)習(xí)、數(shù)據(jù)科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、自然語言處理(NLP)、計算機視覺等相關(guān)領(lǐng)域。
二、核心技術(shù)能力
1. 大模型理論基礎(chǔ)
- 深入理解大模型架構(gòu)(如Transformer、GPT、BERT、Claude、Llama等),熟悉自注意力機制、位置編碼、模型并行化等技術(shù)。
- 掌握大模型預(yù)訓(xùn)練、微調(diào)(Fine-tuning)、提示工程(Prompt Engineering)等核心方法。
2. 實戰(zhàn)經(jīng)驗要求
- 模型開發(fā):主導(dǎo)過大模型的全流程開發(fā),包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、壓縮優(yōu)化、部署等。
- 場景應(yīng)用:熟悉大模型在制造業(yè)垂直領(lǐng)域的落地案例,具備離散制造業(yè)解決方案設(shè)計能力。
- 問題排查:能快速定位大模型訓(xùn)練中的常見問題(如梯度消失/爆炸、過擬合、幻覺現(xiàn)象),并提出改進方案。
3. 工具與框架
- 熟練掌握大模型開發(fā)工具鏈:
- 框架:PyTorch、TensorFlow、Hugging Face Transformers、DeepSpeed等。
- 加速工具:GPU/TPU集群、混合并行(數(shù)據(jù)并行、模型并行、流水線并行)、分布式訓(xùn)練框架(如Horovod)。
- 優(yōu)化工具:量化壓縮(QAT/FT)、剪枝、蒸餾(Knowledge Distillation)等。
- 熟悉大模型推理引擎(如vLLM、Triton)和部署工具(ONNX、TensorRT)。
4. 數(shù)據(jù)處理與治理
- 精通大規(guī)模數(shù)據(jù)處理(清洗、標注、對齊)、數(shù)據(jù)集構(gòu)建(如Supervised/Unsupervised Data)、數(shù)據(jù)質(zhì)量評估。
- 熟悉多模態(tài)數(shù)據(jù)融合(文本、圖像、語音、視頻)及跨模態(tài)建模技術(shù)。
三、行業(yè)經(jīng)驗與場景理解
1. 垂直領(lǐng)域深耕
- 至少擁有1-2個智能制造行業(yè)的完整項目經(jīng)驗,能將大模型技術(shù)與業(yè)務(wù)痛點結(jié)合。
2. 產(chǎn)品化思維
- 能將技術(shù)轉(zhuǎn)化為可落地的產(chǎn)品方案,設(shè)計高可用、低成本的大模型服務(wù)體系(如API接口、SaaS平臺)。
- 熟悉大模型相關(guān)的商業(yè)模式(如訂閱制、按token計費、企業(yè)級私有化部署)。
四、軟性素質(zhì)與能力
1. 溝通與協(xié)作
- 能與技術(shù)團隊(算法工程師、開發(fā)者)、業(yè)務(wù)團隊(產(chǎn)品經(jīng)理、行業(yè)專家)、客戶(企業(yè)決策者)高效溝通,翻譯技術(shù)語言為業(yè)務(wù)價值。
- 具備跨部門協(xié)作經(jīng)驗,推動大模型項目從需求到方案落地的閉環(huán)。
2. 快速學(xué)習(xí)與創(chuàng)新
- 緊跟大模型前沿技術(shù)(如MoE、RLHF、聯(lián)邦學(xué)習(xí)),快速復(fù)現(xiàn)SOTA(State-of-the-Art)算法并適配業(yè)務(wù)場景。
- 具備創(chuàng)新思維,能提出針對大模型局限性的改進方案(如解決“幻覺”問題的強化學(xué)習(xí)策略)。
3.項目管理與風(fēng)控
- 主導(dǎo)過大模型項目全生命周期管理,包括資源調(diào)配、進度把控、成本優(yōu)化。
- 熟悉大模型開發(fā)中的合規(guī)與倫理風(fēng)險(如數(shù)據(jù)隱私、算法偏見、知識產(chǎn)權(quán)保護)。
五、崗位職責
- 負責大模型技術(shù)在智能制造行業(yè)的應(yīng)用場景探索與方案設(shè)計;
- 優(yōu)化大模型訓(xùn)練效率與推理成本,解決復(fù)雜工程問題;
- 負責項目管理,帶領(lǐng)團隊完成大模型項目的實施交付。