国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 11月11日

大數(shù)據(jù)工程師

8000-9000元
  • 重慶璧山區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

數(shù)據(jù)治理數(shù)據(jù)挖掘數(shù)據(jù)建模SqlPythonMatlab互聯(lián)網(wǎng)云計(jì)算/大數(shù)據(jù)人工智能
一、核心職責(zé)
1. 知識(shí)圖譜全流程構(gòu)建與互聯(lián)網(wǎng)產(chǎn)品適配:深入理解互聯(lián)網(wǎng)產(chǎn)品業(yè)務(wù)場(chǎng)景(如電商推薦、社交關(guān)系、內(nèi)容分發(fā)),設(shè)計(jì)貼合產(chǎn)品需求的領(lǐng)域知識(shí)圖譜 Schema(含用戶、商品、內(nèi)容等實(shí)體類型及關(guān)聯(lián)關(guān)系定義);主導(dǎo)從多源異構(gòu)數(shù)據(jù)(用戶行為日志、交易數(shù)據(jù)、非結(jié)構(gòu)化內(nèi)容)中進(jìn)行知識(shí)抽取、融合與推理,解決 “數(shù)據(jù)碎片化”“關(guān)聯(lián)挖掘難” 問題;基于 Neo4j 等圖數(shù)據(jù)庫(kù)搭建知識(shí)存儲(chǔ)與查詢體系,優(yōu)化圖查詢性能,支撐互聯(lián)網(wǎng)產(chǎn)品的智能推薦、個(gè)性化內(nèi)容分發(fā)、用戶關(guān)系分析等場(chǎng)景落地。
2. 用戶人物畫像體系搭建與迭代:圍繞互聯(lián)網(wǎng)產(chǎn)品用戶生命周期(獲客、激活、留存、轉(zhuǎn)化、推薦),設(shè)計(jì)多維度人物畫像標(biāo)簽體系(基礎(chǔ)屬性、行為偏好、興趣標(biāo)簽、價(jià)值分層等);構(gòu)建畫像數(shù)據(jù)采集與計(jì)算模型,通過 SQL 優(yōu)化、批流融合技術(shù)實(shí)現(xiàn)標(biāo)簽實(shí)時(shí) / 準(zhǔn)實(shí)時(shí)更新;結(jié)合知識(shí)圖譜關(guān)聯(lián)用戶多場(chǎng)景行為數(shù)據(jù),提升畫像精準(zhǔn)度,為產(chǎn)品的精細(xì)化運(yùn)營(yíng)、個(gè)性化功能設(shè)計(jì)提供數(shù)據(jù)支撐。
3. 數(shù)據(jù)處理與 SQL 深度優(yōu)化(互聯(lián)網(wǎng)場(chǎng)景適配):負(fù)責(zé)互聯(lián)網(wǎng)產(chǎn)品大規(guī)模數(shù)據(jù)集(用戶行為日志、交易數(shù)據(jù)、內(nèi)容數(shù)據(jù)等)的清洗、轉(zhuǎn)換與整合,設(shè)計(jì)高效 ETL/ELT 流程,解決高并發(fā)場(chǎng)景下的數(shù)據(jù)一致性與質(zhì)量問題;針對(duì)互聯(lián)網(wǎng)產(chǎn)品高頻查詢場(chǎng)景(如用戶畫像標(biāo)簽查詢、商品關(guān)聯(lián)分析),開展 SQL 語(yǔ)句重構(gòu)、索引優(yōu)化、物化視圖設(shè)計(jì)等工作,優(yōu)化 OLAP 引擎(如 StarRocks)查詢性能,降低數(shù)據(jù)處理延遲,保障推薦系統(tǒng)、運(yùn)營(yíng)報(bào)表等核心數(shù)據(jù)服務(wù)穩(wěn)定性。
4. 統(tǒng)計(jì)分析與互聯(lián)網(wǎng)產(chǎn)品業(yè)務(wù)賦能:運(yùn)用統(tǒng)計(jì)學(xué)方法(如回歸分析、聚類分析、假設(shè)檢驗(yàn)、A/B 測(cè)試分析)對(duì)互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)進(jìn)行深度挖掘,構(gòu)建核心業(yè)務(wù)指標(biāo)體系(如 DAU/MAU、轉(zhuǎn)化率、留存率、LTV);從用戶行為、產(chǎn)品功能、運(yùn)營(yíng)活動(dòng)數(shù)據(jù)中提取商業(yè)洞察,針對(duì)產(chǎn)品迭代(功能優(yōu)化、新功能上線)、運(yùn)營(yíng)策略(活動(dòng)策劃、用戶分層運(yùn)營(yíng))輸出專題分析報(bào)告,明確增長(zhǎng)驅(qū)動(dòng)力與風(fēng)險(xiǎn)點(diǎn),為管理層決策提供數(shù)據(jù)支撐。
5. 多工具可視化體系搭建(互聯(lián)網(wǎng)場(chǎng)景聚焦):熟練運(yùn)用多種可視化工具(FineBI、Power BI、Tableau 等)開發(fā)互聯(lián)網(wǎng)產(chǎn)品專屬數(shù)據(jù)看板(用戶畫像看板、運(yùn)營(yíng)監(jiān)控看板、推薦效果看板、功能迭代效果看板),實(shí)現(xiàn)動(dòng)態(tài)鉆取、多維度聯(lián)動(dòng)分析;設(shè)計(jì)標(biāo)準(zhǔn)化可視化規(guī)范,確保報(bào)表兼具數(shù)據(jù)準(zhǔn)確性與視覺可讀性,同時(shí)開展工具使用培訓(xùn),提升產(chǎn)品、運(yùn)營(yíng)團(tuán)隊(duì)自主分析能力,助力快速?zèng)Q策。
6. 跨團(tuán)隊(duì)協(xié)同與互聯(lián)網(wǎng)產(chǎn)品流程優(yōu)化:對(duì)接互聯(lián)網(wǎng)產(chǎn)品團(tuán)隊(duì)、運(yùn)營(yíng)團(tuán)隊(duì)、研發(fā)團(tuán)隊(duì)梳理數(shù)據(jù)需求,提供從數(shù)據(jù)采集、圖譜構(gòu)建、畫像計(jì)算到分析可視化的端到端解決方案;跟蹤大數(shù)據(jù)技術(shù)趨勢(shì)(如實(shí)時(shí)數(shù)倉(cāng)、智能 BI、大模型與知識(shí)圖譜融合),結(jié)合互聯(lián)網(wǎng)產(chǎn)品快速迭代特性,優(yōu)化數(shù)據(jù)處理鏈路與工具選型,推動(dòng)數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品迭代與運(yùn)營(yíng)優(yōu)化,助力產(chǎn)品增長(zhǎng)。
7. AI 技術(shù)融合與數(shù)據(jù)挖掘落地:結(jié)合 AI 技術(shù)(如大模型、機(jī)器學(xué)習(xí)算法)優(yōu)化知識(shí)圖譜構(gòu)建與用戶畫像精度,例如利用大模型提升非結(jié)構(gòu)化數(shù)據(jù)知識(shí)抽取效率,通過機(jī)器學(xué)習(xí)算法優(yōu)化用戶標(biāo)簽權(quán)重計(jì)算;開展數(shù)據(jù)挖掘項(xiàng)目,從海量互聯(lián)網(wǎng)數(shù)據(jù)中挖掘用戶潛在需求、行為規(guī)律及業(yè)務(wù)增長(zhǎng)機(jī)會(huì),輸出可落地的挖掘模型與應(yīng)用方案。
8. 數(shù)據(jù)標(biāo)注體系搭建與質(zhì)量管控:針對(duì) AI 模型訓(xùn)練、知識(shí)圖譜構(gòu)建需求,設(shè)計(jì)數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)與流程(如實(shí)體標(biāo)注、關(guān)系標(biāo)注、情感標(biāo)注),協(xié)調(diào)標(biāo)注團(tuán)隊(duì)開展工作;建立標(biāo)注質(zhì)量校驗(yàn)機(jī)制(如抽樣檢查、交叉驗(yàn)證),保障標(biāo)注數(shù)據(jù)準(zhǔn)確性,為 AI 模型優(yōu)化、知識(shí)圖譜精準(zhǔn)度提升提供高質(zhì)量數(shù)據(jù)支撐。
二、任職要求
1. 學(xué)歷背景:本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)、人工智能等相關(guān)專業(yè)優(yōu)先;碩士學(xué)歷且有互聯(lián)網(wǎng)產(chǎn)品知識(shí)圖譜、用戶畫像或 AI 數(shù)據(jù)處理相關(guān)經(jīng)驗(yàn)者加分。
2. 工作經(jīng)驗(yàn):3 年以上大數(shù)據(jù)處理相關(guān)經(jīng)驗(yàn),具備完整的知識(shí)圖譜構(gòu)建與用戶畫像落地案例;有電商、社交、內(nèi)容資訊、工具類等互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)處理經(jīng)驗(yàn)者優(yōu)先;具備 AI 技術(shù)(如大模型應(yīng)用、機(jī)器學(xué)習(xí))在數(shù)據(jù)處理中的實(shí)踐經(jīng)驗(yàn),或有數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注項(xiàng)目主導(dǎo)經(jīng)驗(yàn)者優(yōu)先;熟悉互聯(lián)網(wǎng)產(chǎn)品實(shí)時(shí)數(shù)倉(cāng)搭建、高并發(fā)查詢優(yōu)化或用戶增長(zhǎng)數(shù)據(jù)分析場(chǎng)景者優(yōu)先。
3. 專業(yè)技能:
(1) 數(shù)據(jù)技術(shù)棧:精通 SQL,熟練使用 Python(Pandas、NumPy、Scikit-learn、PySpark)或 Java,掌握 Hadoop、Spark 等大數(shù)據(jù)框架,具備批處理與流處理(Kafka、Flink)開發(fā)能力,能處理互聯(lián)網(wǎng)產(chǎn)品高頻產(chǎn)生的海量用戶行為數(shù)據(jù);
(2) 知識(shí)圖譜能力:熟悉 NLP 基礎(chǔ)技術(shù)(分詞、命名實(shí)體識(shí)別、關(guān)系抽取、實(shí)體鏈接),能基于 spaCy、DeepKE、LTP 等工具進(jìn)行互聯(lián)網(wǎng)場(chǎng)景(如商品實(shí)體抽取、用戶關(guān)系挖掘、內(nèi)容標(biāo)簽抽?。┲R(shí)抽取調(diào)優(yōu);精通 Neo4j 等圖數(shù)據(jù)庫(kù)及 Cypher/Gremlin 查詢語(yǔ)言,具備圖譜性能優(yōu)化經(jīng)驗(yàn),能支撐互聯(lián)網(wǎng)產(chǎn)品高并發(fā)查詢需求;
(3) 用戶畫像能力:掌握人物畫像構(gòu)建方法論,熟悉標(biāo)簽體系設(shè)計(jì)(多層級(jí)標(biāo)簽、標(biāo)簽權(quán)重計(jì)算、標(biāo)簽衰減規(guī)則),具備基于 Hive、Spark、Flink 實(shí)現(xiàn)實(shí)時(shí) / 準(zhǔn)實(shí)時(shí)標(biāo)簽計(jì)算的經(jīng)驗(yàn);能結(jié)合互聯(lián)網(wǎng)產(chǎn)品用戶行為數(shù)據(jù)(瀏覽、點(diǎn)擊、購(gòu)買、互動(dòng)等)優(yōu)化畫像模型,提升標(biāo)簽精準(zhǔn)度,有畫像在推薦系統(tǒng)、個(gè)性化運(yùn)營(yíng)中落地的實(shí)戰(zhàn)經(jīng)驗(yàn);
(4) 統(tǒng)計(jì)與優(yōu)化能力:扎實(shí)掌握統(tǒng)計(jì)學(xué)原理與互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)分析方法論(A/B 測(cè)試設(shè)計(jì)與分析、漏斗分析、留存分析、用戶分群分析),能獨(dú)立設(shè)計(jì)產(chǎn)品迭代、運(yùn)營(yíng)活動(dòng)的分析模型;具備 SQL 優(yōu)化實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉 StarRocks、ClickHouse 等 OLAP 引擎架構(gòu),能解決互聯(lián)網(wǎng)產(chǎn)品高并發(fā)查詢(如高峰時(shí)段用戶畫像查詢、運(yùn)營(yíng)活動(dòng)數(shù)據(jù)查詢)瓶頸;
(5) 可視化能力:熟練運(yùn)用至少 2 種主流可視化工具(FineBI/Power BI/Tableau),能獨(dú)立開發(fā)互聯(lián)網(wǎng)產(chǎn)品復(fù)雜業(yè)務(wù)看板(如用戶增長(zhǎng)看板、推薦轉(zhuǎn)化漏斗看板、畫像標(biāo)簽分布看板),有可視化規(guī)范搭建或針對(duì)互聯(lián)網(wǎng)高頻數(shù)據(jù)更新場(chǎng)景的可視化性能優(yōu)化案例者優(yōu)先;
(6) AI 與數(shù)據(jù)挖掘能力:熟悉機(jī)器學(xué)習(xí)算法(如分類、聚類、回歸、協(xié)同過濾),能使用 Scikit-learn、TensorFlow/PyTorch 等工具構(gòu)建數(shù)據(jù)挖掘模型(如用戶流失預(yù)測(cè)、商品推薦模型);了解大模型(如 GPT 系列、開源大模型)應(yīng)用場(chǎng)景,有利用大模型優(yōu)化數(shù)據(jù)處理(如文本數(shù)據(jù)清洗、知識(shí)問答)經(jīng)驗(yàn)者優(yōu)先;
(7) 數(shù)據(jù)標(biāo)注能力:掌握數(shù)據(jù)標(biāo)注方法論,能設(shè)計(jì)符合 AI 模型訓(xùn)練、知識(shí)圖譜構(gòu)建需求的標(biāo)注標(biāo)準(zhǔn)(如實(shí)體標(biāo)注規(guī)范、關(guān)系標(biāo)注流程);具備標(biāo)注質(zhì)量管控經(jīng)驗(yàn),能通過抽樣校驗(yàn)、標(biāo)注工具優(yōu)化提升標(biāo)注效率與準(zhǔn)確性,有搭建標(biāo)注團(tuán)隊(duì)或管理標(biāo)注項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
1. 綜合能力:
(1) 具備 “技術(shù) + 互聯(lián)網(wǎng)產(chǎn)品 + 業(yè)務(wù)” 三重理解能力,能深入理解互聯(lián)網(wǎng)產(chǎn)品邏輯(如推薦算法邏輯、用戶增長(zhǎng)模型、運(yùn)營(yíng)活動(dòng)機(jī)制),從產(chǎn)品、運(yùn)營(yíng)需求中抽象數(shù)據(jù)模型與分析框架;
(2) 邏輯思維縝密,問題解決能力突出,能快速定位互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)質(zhì)量(如用戶行為數(shù)據(jù)缺失、畫像標(biāo)簽不準(zhǔn))、查詢性能(如高峰時(shí)段報(bào)表加載慢)等問題并提出解決方案;
(3) 優(yōu)秀的跨團(tuán)隊(duì)溝通能力,能高效對(duì)接互聯(lián)網(wǎng)產(chǎn)品經(jīng)理、運(yùn)營(yíng)、研發(fā)團(tuán)隊(duì),清晰傳遞數(shù)據(jù)價(jià)值,推動(dòng)數(shù)據(jù)項(xiàng)目落地與知識(shí)沉淀,助力產(chǎn)品迭代與運(yùn)營(yíng)優(yōu)化;
(4) 對(duì)互聯(lián)網(wǎng)行業(yè)趨勢(shì)(如 AIGC 在產(chǎn)品中的應(yīng)用、私域流量運(yùn)營(yíng)、精細(xì)化用戶運(yùn)營(yíng))及 AI 技術(shù)發(fā)展(如大模型輕量化、機(jī)器學(xué)習(xí)工程化)敏感,能結(jié)合數(shù)據(jù)技術(shù)為產(chǎn)品創(chuàng)新與業(yè)務(wù)增長(zhǎng)提供新思路。
2. 加分項(xiàng):
(1) 有 Transformer 系列模型(BERT、RoBERTa)或大模型在互聯(lián)網(wǎng)場(chǎng)景知識(shí)抽?。ㄈ缟唐吩u(píng)論情感分析、用戶興趣標(biāo)簽挖掘)、數(shù)據(jù)挖掘(如個(gè)性化推薦、用戶意圖識(shí)別)中的應(yīng)用經(jīng)驗(yàn),或主導(dǎo)過千萬級(jí)節(jié)點(diǎn)互聯(lián)網(wǎng)產(chǎn)品知識(shí)圖譜項(xiàng)目者優(yōu)先;
(2) 具備互聯(lián)網(wǎng)產(chǎn)品用戶畫像平臺(tái)搭建經(jīng)驗(yàn),能設(shè)計(jì)可配置化標(biāo)簽體系、支持多業(yè)務(wù)線畫像復(fù)用,或有數(shù)據(jù)挖掘模型(如用戶生命周期價(jià)值預(yù)測(cè)模型)落地并帶來業(yè)務(wù)增長(zhǎng)(如轉(zhuǎn)化率提升、流失率下降)者優(yōu)先;
(3) 熟悉 CDC/binlog 實(shí)時(shí)同步技術(shù)、Flink SQL 實(shí)時(shí)計(jì)算,有互聯(lián)網(wǎng)產(chǎn)品實(shí)時(shí)用戶畫像、實(shí)時(shí)推薦效果分析或?qū)崟r(shí)數(shù)據(jù)挖掘模型落地經(jīng)驗(yàn)者優(yōu)先;
(4) 具備 PMP/ACP 等項(xiàng)目管理認(rèn)證,或擁有大數(shù)據(jù)技術(shù)、AI 相關(guān)專利、論文,或有主導(dǎo)大規(guī)模數(shù)據(jù)標(biāo)注項(xiàng)目(如百萬級(jí)文本標(biāo)注、圖譜實(shí)體標(biāo)注)經(jīng)驗(yàn)者優(yōu)先。

工作地點(diǎn)

重慶璧山區(qū)璧山企業(yè)天地

職位發(fā)布者

李轉(zhuǎn)紅/人事經(jīng)理

昨日活躍
立即溝通