国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

該職位已失效,看看其他機會吧

數(shù)據工程師(深度學習/大模型方向)

1.5-2.5萬
  • 上海浦東新區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招2人

雇員點評標簽

  • 工作環(huán)境好
  • 同事很nice
  • 團隊執(zhí)行強
  • 人際關系好
  • 氛圍活躍
  • 交通便利
  • 實力大公司
  • 五險一金

職位描述

人工智能云計算/大數(shù)據
崗位職責
1. 數(shù)據基礎設施構建
1.1 設計并搭建面向深度學習和大模型訓練的高效數(shù)據管道(Data Pipeline),支持TB/PB級多模態(tài)數(shù)據(文本、圖像、語音等)的采集、清洗、存儲與分布式處理。
1.2 優(yōu)化數(shù)據預處理流程(ETL/ELT),提升數(shù)據吞吐量與處理效率,滿足大模型訓練對海量數(shù)據的實時性需求。
2. 數(shù)據質量管理
2.1 開發(fā)數(shù)據質量監(jiān)控工具,識別并修復數(shù)據噪聲、缺失、偏差等問題,確保訓練數(shù)據的可靠性。
2.2 建立數(shù)據版本控制機制,跟蹤數(shù)據變更歷史,支持模型訓練的可復現(xiàn)性。
3. 分布式數(shù)據處理
3.1 基于Spark、Flink、Ray等框架構建分布式數(shù)據處理系統(tǒng),加速數(shù)據并行與模型訓練效率。
3.2 與算法團隊協(xié)作,優(yōu)化數(shù)據分片、采樣策略,適配分布式訓練框架。
4. 數(shù)據合規(guī)與安全
4.1 設計數(shù)據脫敏、匿名化方案,確保敏感數(shù)據(如用戶隱私數(shù)據)符合GDPR等法規(guī)要求。
4.2 構建數(shù)據權限管理體系,實現(xiàn)細粒度訪問控制。
任職要求
1. 精通Python,熟悉SQL及至少一種大數(shù)據框架(Spark/Flink)。
2. 熟練使用Airflow、Kafka、Dagster等工具構建數(shù)據工作流。
3. 熟悉數(shù)據湖(Delta Lake/Iceberg)、向量數(shù)據庫(Milvus/Pinecone)等新型存儲技術。
4. 理解深度學習數(shù)據需求:掌握TFDS、HuggingFace Datasets等工具,熟悉數(shù)據并行/流水線并行邏輯。
經驗背景
1. 3年以上數(shù)據工程經驗,至少1年支持過大規(guī)模模型(LLM/CV大模型)數(shù)據體系建設。
2. 有完整的數(shù)據治理項目經驗,熟悉數(shù)據血緣追蹤、元數(shù)據管理(如Apache Atlas)。
查看全部

工作地點

上海浦東新區(qū)科技領袖之都43號樓

職位發(fā)布者

周蓓麗/人事經理

立即溝通
公司Logo浪潮集團公司標簽
浪潮集團是中國領先的云計算、大數(shù)據服務商,擁有三家上市公司。主要業(yè)務涉及計算裝備、軟件、云計算服務、新一代通信、大數(shù)據及若干應用場景。作為中國最早的IT品牌之一,浪潮致力于成為世界一流的新一代信息技術龍頭企業(yè)經濟社會數(shù)字化轉型的優(yōu)秀服務商,新型基礎設施建設的骨干企業(yè)。
公司主頁