国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月10日

大數(shù)據(jù)工程師

8000-9000元
  • 重慶璧山區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

數(shù)據(jù)治理數(shù)據(jù)挖掘數(shù)據(jù)建模SqlPythonMatlab互聯(lián)網(wǎng)云計算/大數(shù)據(jù)人工智能
一、核心職責(zé)
1. 知識圖譜全流程構(gòu)建與互聯(lián)網(wǎng)產(chǎn)品適配:深入理解互聯(lián)網(wǎng)產(chǎn)品業(yè)務(wù)場景(如電商推薦、社交關(guān)系、內(nèi)容分發(fā)),設(shè)計貼合產(chǎn)品需求的領(lǐng)域知識圖譜 Schema(含用戶、商品、內(nèi)容等實體類型及關(guān)聯(lián)關(guān)系定義);主導(dǎo)從多源異構(gòu)數(shù)據(jù)(用戶行為日志、交易數(shù)據(jù)、非結(jié)構(gòu)化內(nèi)容)中進(jìn)行知識抽取、融合與推理,解決 “數(shù)據(jù)碎片化”“關(guān)聯(lián)挖掘難” 問題;基于 Neo4j 等圖數(shù)據(jù)庫搭建知識存儲與查詢體系,優(yōu)化圖查詢性能,支撐互聯(lián)網(wǎng)產(chǎn)品的智能推薦、個性化內(nèi)容分發(fā)、用戶關(guān)系分析等場景落地。
2. 用戶人物畫像體系搭建與迭代:圍繞互聯(lián)網(wǎng)產(chǎn)品用戶生命周期(獲客、激活、留存、轉(zhuǎn)化、推薦),設(shè)計多維度人物畫像標(biāo)簽體系(基礎(chǔ)屬性、行為偏好、興趣標(biāo)簽、價值分層等);構(gòu)建畫像數(shù)據(jù)采集與計算模型,通過 SQL 優(yōu)化、批流融合技術(shù)實現(xiàn)標(biāo)簽實時 / 準(zhǔn)實時更新;結(jié)合知識圖譜關(guān)聯(lián)用戶多場景行為數(shù)據(jù),提升畫像精準(zhǔn)度,為產(chǎn)品的精細(xì)化運營、個性化功能設(shè)計提供數(shù)據(jù)支撐。
3. 數(shù)據(jù)處理與 SQL 深度優(yōu)化(互聯(lián)網(wǎng)場景適配):負(fù)責(zé)互聯(lián)網(wǎng)產(chǎn)品大規(guī)模數(shù)據(jù)集(用戶行為日志、交易數(shù)據(jù)、內(nèi)容數(shù)據(jù)等)的清洗、轉(zhuǎn)換與整合,設(shè)計高效 ETL/ELT 流程,解決高并發(fā)場景下的數(shù)據(jù)一致性與質(zhì)量問題;針對互聯(lián)網(wǎng)產(chǎn)品高頻查詢場景(如用戶畫像標(biāo)簽查詢、商品關(guān)聯(lián)分析),開展 SQL 語句重構(gòu)、索引優(yōu)化、物化視圖設(shè)計等工作,優(yōu)化 OLAP 引擎(如 StarRocks)查詢性能,降低數(shù)據(jù)處理延遲,保障推薦系統(tǒng)、運營報表等核心數(shù)據(jù)服務(wù)穩(wěn)定性。
4. 統(tǒng)計分析與互聯(lián)網(wǎng)產(chǎn)品業(yè)務(wù)賦能:運用統(tǒng)計學(xué)方法(如回歸分析、聚類分析、假設(shè)檢驗、A/B 測試分析)對互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)進(jìn)行深度挖掘,構(gòu)建核心業(yè)務(wù)指標(biāo)體系(如 DAU/MAU、轉(zhuǎn)化率、留存率、LTV);從用戶行為、產(chǎn)品功能、運營活動數(shù)據(jù)中提取商業(yè)洞察,針對產(chǎn)品迭代(功能優(yōu)化、新功能上線)、運營策略(活動策劃、用戶分層運營)輸出專題分析報告,明確增長驅(qū)動力與風(fēng)險點,為管理層決策提供數(shù)據(jù)支撐。
5. 多工具可視化體系搭建(互聯(lián)網(wǎng)場景聚焦):熟練運用多種可視化工具(FineBI、Power BI、Tableau 等)開發(fā)互聯(lián)網(wǎng)產(chǎn)品專屬數(shù)據(jù)看板(用戶畫像看板、運營監(jiān)控看板、推薦效果看板、功能迭代效果看板),實現(xiàn)動態(tài)鉆取、多維度聯(lián)動分析;設(shè)計標(biāo)準(zhǔn)化可視化規(guī)范,確保報表兼具數(shù)據(jù)準(zhǔn)確性與視覺可讀性,同時開展工具使用培訓(xùn),提升產(chǎn)品、運營團隊自主分析能力,助力快速決策。
6. 跨團隊協(xié)同與互聯(lián)網(wǎng)產(chǎn)品流程優(yōu)化:對接互聯(lián)網(wǎng)產(chǎn)品團隊、運營團隊、研發(fā)團隊梳理數(shù)據(jù)需求,提供從數(shù)據(jù)采集、圖譜構(gòu)建、畫像計算到分析可視化的端到端解決方案;跟蹤大數(shù)據(jù)技術(shù)趨勢(如實時數(shù)倉、智能 BI、大模型與知識圖譜融合),結(jié)合互聯(lián)網(wǎng)產(chǎn)品快速迭代特性,優(yōu)化數(shù)據(jù)處理鏈路與工具選型,推動數(shù)據(jù)驅(qū)動的產(chǎn)品迭代與運營優(yōu)化,助力產(chǎn)品增長。
7. AI 技術(shù)融合與數(shù)據(jù)挖掘落地:結(jié)合 AI 技術(shù)(如大模型、機器學(xué)習(xí)算法)優(yōu)化知識圖譜構(gòu)建與用戶畫像精度,例如利用大模型提升非結(jié)構(gòu)化數(shù)據(jù)知識抽取效率,通過機器學(xué)習(xí)算法優(yōu)化用戶標(biāo)簽權(quán)重計算;開展數(shù)據(jù)挖掘項目,從海量互聯(lián)網(wǎng)數(shù)據(jù)中挖掘用戶潛在需求、行為規(guī)律及業(yè)務(wù)增長機會,輸出可落地的挖掘模型與應(yīng)用方案。
8. 數(shù)據(jù)標(biāo)注體系搭建與質(zhì)量管控:針對 AI 模型訓(xùn)練、知識圖譜構(gòu)建需求,設(shè)計數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)與流程(如實體標(biāo)注、關(guān)系標(biāo)注、情感標(biāo)注),協(xié)調(diào)標(biāo)注團隊開展工作;建立標(biāo)注質(zhì)量校驗機制(如抽樣檢查、交叉驗證),保障標(biāo)注數(shù)據(jù)準(zhǔn)確性,為 AI 模型優(yōu)化、知識圖譜精準(zhǔn)度提升提供高質(zhì)量數(shù)據(jù)支撐。
二、任職要求
1. 學(xué)歷背景:本科及以上學(xué)歷,計算機科學(xué)、數(shù)據(jù)科學(xué)、統(tǒng)計學(xué)、數(shù)學(xué)、人工智能等相關(guān)專業(yè)優(yōu)先;碩士學(xué)歷且有互聯(lián)網(wǎng)產(chǎn)品知識圖譜、用戶畫像或 AI 數(shù)據(jù)處理相關(guān)經(jīng)驗者加分。
2. 工作經(jīng)驗:3 年以上大數(shù)據(jù)處理相關(guān)經(jīng)驗,具備完整的知識圖譜構(gòu)建與用戶畫像落地案例;有電商、社交、內(nèi)容資訊、工具類等互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)處理經(jīng)驗者優(yōu)先;具備 AI 技術(shù)(如大模型應(yīng)用、機器學(xué)習(xí))在數(shù)據(jù)處理中的實踐經(jīng)驗,或有數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注項目主導(dǎo)經(jīng)驗者優(yōu)先;熟悉互聯(lián)網(wǎng)產(chǎn)品實時數(shù)倉搭建、高并發(fā)查詢優(yōu)化或用戶增長數(shù)據(jù)分析場景者優(yōu)先。
3. 專業(yè)技能:
(1) 數(shù)據(jù)技術(shù)棧:精通 SQL,熟練使用 Python(Pandas、NumPy、Scikit-learn、PySpark)或 Java,掌握 Hadoop、Spark 等大數(shù)據(jù)框架,具備批處理與流處理(Kafka、Flink)開發(fā)能力,能處理互聯(lián)網(wǎng)產(chǎn)品高頻產(chǎn)生的海量用戶行為數(shù)據(jù);
(2) 知識圖譜能力:熟悉 NLP 基礎(chǔ)技術(shù)(分詞、命名實體識別、關(guān)系抽取、實體鏈接),能基于 spaCy、DeepKE、LTP 等工具進(jìn)行互聯(lián)網(wǎng)場景(如商品實體抽取、用戶關(guān)系挖掘、內(nèi)容標(biāo)簽抽?。┲R抽取調(diào)優(yōu);精通 Neo4j 等圖數(shù)據(jù)庫及 Cypher/Gremlin 查詢語言,具備圖譜性能優(yōu)化經(jīng)驗,能支撐互聯(lián)網(wǎng)產(chǎn)品高并發(fā)查詢需求;
(3) 用戶畫像能力:掌握人物畫像構(gòu)建方法論,熟悉標(biāo)簽體系設(shè)計(多層級標(biāo)簽、標(biāo)簽權(quán)重計算、標(biāo)簽衰減規(guī)則),具備基于 Hive、Spark、Flink 實現(xiàn)實時 / 準(zhǔn)實時標(biāo)簽計算的經(jīng)驗;能結(jié)合互聯(lián)網(wǎng)產(chǎn)品用戶行為數(shù)據(jù)(瀏覽、點擊、購買、互動等)優(yōu)化畫像模型,提升標(biāo)簽精準(zhǔn)度,有畫像在推薦系統(tǒng)、個性化運營中落地的實戰(zhàn)經(jīng)驗;
(4) 統(tǒng)計與優(yōu)化能力:扎實掌握統(tǒng)計學(xué)原理與互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)分析方法論(A/B 測試設(shè)計與分析、漏斗分析、留存分析、用戶分群分析),能獨立設(shè)計產(chǎn)品迭代、運營活動的分析模型;具備 SQL 優(yōu)化實戰(zhàn)經(jīng)驗,熟悉 StarRocks、ClickHouse 等 OLAP 引擎架構(gòu),能解決互聯(lián)網(wǎng)產(chǎn)品高并發(fā)查詢(如高峰時段用戶畫像查詢、運營活動數(shù)據(jù)查詢)瓶頸;
(5) 可視化能力:熟練運用至少 2 種主流可視化工具(FineBI/Power BI/Tableau),能獨立開發(fā)互聯(lián)網(wǎng)產(chǎn)品復(fù)雜業(yè)務(wù)看板(如用戶增長看板、推薦轉(zhuǎn)化漏斗看板、畫像標(biāo)簽分布看板),有可視化規(guī)范搭建或針對互聯(lián)網(wǎng)高頻數(shù)據(jù)更新場景的可視化性能優(yōu)化案例者優(yōu)先;
(6) AI 與數(shù)據(jù)挖掘能力:熟悉機器學(xué)習(xí)算法(如分類、聚類、回歸、協(xié)同過濾),能使用 Scikit-learn、TensorFlow/PyTorch 等工具構(gòu)建數(shù)據(jù)挖掘模型(如用戶流失預(yù)測、商品推薦模型);了解大模型(如 GPT 系列、開源大模型)應(yīng)用場景,有利用大模型優(yōu)化數(shù)據(jù)處理(如文本數(shù)據(jù)清洗、知識問答)經(jīng)驗者優(yōu)先;
(7) 數(shù)據(jù)標(biāo)注能力:掌握數(shù)據(jù)標(biāo)注方法論,能設(shè)計符合 AI 模型訓(xùn)練、知識圖譜構(gòu)建需求的標(biāo)注標(biāo)準(zhǔn)(如實體標(biāo)注規(guī)范、關(guān)系標(biāo)注流程);具備標(biāo)注質(zhì)量管控經(jīng)驗,能通過抽樣校驗、標(biāo)注工具優(yōu)化提升標(biāo)注效率與準(zhǔn)確性,有搭建標(biāo)注團隊或管理標(biāo)注項目經(jīng)驗者優(yōu)先。
1. 綜合能力:
(1) 具備 “技術(shù) + 互聯(lián)網(wǎng)產(chǎn)品 + 業(yè)務(wù)” 三重理解能力,能深入理解互聯(lián)網(wǎng)產(chǎn)品邏輯(如推薦算法邏輯、用戶增長模型、運營活動機制),從產(chǎn)品、運營需求中抽象數(shù)據(jù)模型與分析框架;
(2) 邏輯思維縝密,問題解決能力突出,能快速定位互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)質(zhì)量(如用戶行為數(shù)據(jù)缺失、畫像標(biāo)簽不準(zhǔn))、查詢性能(如高峰時段報表加載慢)等問題并提出解決方案;
(3) 優(yōu)秀的跨團隊溝通能力,能高效對接互聯(lián)網(wǎng)產(chǎn)品經(jīng)理、運營、研發(fā)團隊,清晰傳遞數(shù)據(jù)價值,推動數(shù)據(jù)項目落地與知識沉淀,助力產(chǎn)品迭代與運營優(yōu)化;
(4) 對互聯(lián)網(wǎng)行業(yè)趨勢(如 AIGC 在產(chǎn)品中的應(yīng)用、私域流量運營、精細(xì)化用戶運營)及 AI 技術(shù)發(fā)展(如大模型輕量化、機器學(xué)習(xí)工程化)敏感,能結(jié)合數(shù)據(jù)技術(shù)為產(chǎn)品創(chuàng)新與業(yè)務(wù)增長提供新思路。
2. 加分項:
(1) 有 Transformer 系列模型(BERT、RoBERTa)或大模型在互聯(lián)網(wǎng)場景知識抽取(如商品評論情感分析、用戶興趣標(biāo)簽挖掘)、數(shù)據(jù)挖掘(如個性化推薦、用戶意圖識別)中的應(yīng)用經(jīng)驗,或主導(dǎo)過千萬級節(jié)點互聯(lián)網(wǎng)產(chǎn)品知識圖譜項目者優(yōu)先;
(2) 具備互聯(lián)網(wǎng)產(chǎn)品用戶畫像平臺搭建經(jīng)驗,能設(shè)計可配置化標(biāo)簽體系、支持多業(yè)務(wù)線畫像復(fù)用,或有數(shù)據(jù)挖掘模型(如用戶生命周期價值預(yù)測模型)落地并帶來業(yè)務(wù)增長(如轉(zhuǎn)化率提升、流失率下降)者優(yōu)先;
(3) 熟悉 CDC/binlog 實時同步技術(shù)、Flink SQL 實時計算,有互聯(lián)網(wǎng)產(chǎn)品實時用戶畫像、實時推薦效果分析或?qū)崟r數(shù)據(jù)挖掘模型落地經(jīng)驗者優(yōu)先;
(4) 具備 PMP/ACP 等項目管理認(rèn)證,或擁有大數(shù)據(jù)技術(shù)、AI 相關(guān)專利、論文,或有主導(dǎo)大規(guī)模數(shù)據(jù)標(biāo)注項目(如百萬級文本標(biāo)注、圖譜實體標(biāo)注)經(jīng)驗者優(yōu)先。

工作地點

重慶璧山區(qū)璧山企業(yè)天地

職位發(fā)布者

李轉(zhuǎn)紅/人事經(jīng)理

剛剛活躍
立即溝通