崗位職責:
1.根據不同的應用場景和業(yè)務需求,選擇合適的神經網絡結構、算法和技術,如Transformer 架構、注意力機制等,確保模型微調后具備良好的性能表現(xiàn)。
2.收集、整理和預處理大規(guī)模的數(shù)據集,包括數(shù)據清洗、標注、歸一化等操作,以提高數(shù)據質量,為模型訓練提供可靠的數(shù)據支持。
3.負責API的設計、開發(fā)與維護、以及與第三方軟件對接聯(lián)調工作。
4.持續(xù)探索在各種場景下,利用AI能力增強產品體驗,提升工程效率。
任職要求:
1.本科及以上學歷,計算機科學、數(shù)學、物理學、人工智能、自動化等相關專業(yè)背景優(yōu)先。
2.具有3年以上多模態(tài)模型開發(fā)和優(yōu)化的實操經驗,作為項目的主要負責人進行過相關產品的研發(fā)。
3.具備扎實的算法功底和編程能力,熟練掌握Pvthon,熟悉PyTorch或TensorFlow等深度學習框架,有百億/千億大模型分布式訓練經驗;
4.具備熟練的英文技術文獻閱讀能力,能夠及時了解國際上最新的 AI 研究成果和技術動態(tài)。
5.遵守代碼規(guī)范,工作認真負責,溝通能力好,有團隊協(xié)作精神。