崗位職責(zé):
1. 獨立負責(zé)從指定網(wǎng)站、微信公眾號、小紅書等平臺進行數(shù)據(jù)的高效、穩(wěn)定爬取。
2. 對獲取的原始數(shù)據(jù)進行深度清洗、去重、結(jié)構(gòu)化處理,確保數(shù)據(jù)質(zhì)量與可用性。
3. 根據(jù)產(chǎn)品需求,設(shè)計并實現(xiàn)數(shù)據(jù)解析與轉(zhuǎn)換邏輯,將處理后的數(shù)據(jù)以標準化的展示格式對接至產(chǎn)品系統(tǒng)。
4. 維護和優(yōu)化現(xiàn)有爬蟲系統(tǒng),應(yīng)對反爬策略,保障數(shù)據(jù)通道的長期穩(wěn)定與高效。
5. 編寫清晰的技術(shù)文檔,并與產(chǎn)品、研發(fā)團隊緊密協(xié)作,理解需求并交付可靠的數(shù)據(jù)解決方案。
任職要求:
1. 本科及以上學(xué)歷,計算機相關(guān)專業(yè),擁有2-3年以上專職爬蟲開發(fā)經(jīng)驗。
2. 技術(shù)非常熟練,精通Python及相關(guān)生態(tài)(如Scrapy、Requests、Selenium、Playwright等),熟悉常見的數(shù)據(jù)解析技術(shù)。
3. 有豐富的反爬應(yīng)對經(jīng)驗,能熟練處理各類驗證碼、動態(tài)加載、請求加密等技術(shù)挑戰(zhàn)。
4. 具備扎實的數(shù)據(jù)處理能力,熟悉Pandas等工具,能獨立完成從爬取到清洗的全流程工作。
5. 有微信公眾號、小紅書等平臺爬取經(jīng)驗者優(yōu)先考慮。
6. 責(zé)任心強,具備優(yōu)秀的問題解決能力和結(jié)果導(dǎo)向思維,能保證任務(wù)的按時高質(zhì)量交付。
我們提供:
1. 具有競爭力的薪酬待遇:待遇優(yōu)厚,為您的才華提供相匹配的回報。
2. 完善的福利保障:五險一金、帶薪年假、年度體檢、節(jié)日福利等。
3. 健康的工作節(jié)奏:標準工作時間,早九晚六,雙休,我們關(guān)注成果而非形式。
4. 精英化的工作環(huán)境:與行業(yè)內(nèi)頂尖、專業(yè)的伙伴共事,扁平化管理,溝通高效。
5. 持續(xù)的成長機會:參與創(chuàng)新項目,接觸前沿技術(shù),獲得快速的個人能力提升。