崗位職責(zé):
1. 開展基于團(tuán)隊(duì)自研的數(shù)據(jù)系統(tǒng)的研發(fā)(圖數(shù)據(jù)庫、向量數(shù)據(jù)庫等),參與公司自研的向量數(shù)據(jù)庫核心模塊的設(shè)計(jì)、開發(fā)與性能優(yōu)化,重點(diǎn)涵蓋查詢執(zhí)行器、索引管理、實(shí)現(xiàn)高性能向量檢索算法(HNSW、IVF-PQ、ScaNN、DiskANN 等)等。
2. 探索向量數(shù)據(jù)庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫、圖數(shù)據(jù)庫融合的多模態(tài)數(shù)據(jù)庫架構(gòu),設(shè)計(jì)下一代多模態(tài)數(shù)據(jù)庫架構(gòu)。
3. 開展大語言模型的應(yīng)用設(shè)計(jì)與開發(fā),包括 RAG、Agent等核心場景。
4. 基于國產(chǎn)硬件平臺與團(tuán)隊(duì)自研的國產(chǎn)數(shù)據(jù)系統(tǒng)設(shè)計(jì)端到端的數(shù)據(jù)智能應(yīng)用,涵蓋模型推理服務(wù)、知識檢索、記憶緩存與用戶交互方式。
5. 結(jié)合業(yè)務(wù)需求,設(shè)計(jì)數(shù)據(jù)流、提示鏈與工具調(diào)用鏈,持續(xù)優(yōu)化數(shù)據(jù)服務(wù)的生成質(zhì)量與效率。
6. 與模型團(tuán)隊(duì)、后端開發(fā)團(tuán)隊(duì)協(xié)同,完成自研數(shù)據(jù)智能應(yīng)用的國產(chǎn)化應(yīng)用落地,并持續(xù)優(yōu)化應(yīng)用運(yùn)行情況。
7. 持續(xù)跟蹤開源與商業(yè)的LLM應(yīng)用生態(tài),評估并引入適合的框架或工具。
崗位要求:
1. 計(jì)算機(jī)、軟件工程或相關(guān)專業(yè)碩士或博士,計(jì)算機(jī)體系結(jié)構(gòu)、操作系統(tǒng)等基本功扎實(shí)。
2. 深刻理解大語言模型的工作原理(Transformer、RAG Pipeline 等),熟悉多輪對話、工具調(diào)用、長文本擴(kuò)寫等場景的架構(gòu)模式。
3. 精通Python、C++或者Java語言,熟悉 LangChain / LlamaIndex / FastAPI 等框架進(jìn)行快速迭代與部署。
4. 熟悉常見數(shù)據(jù)系統(tǒng):關(guān)系型(PostgreSQL、MySQL)、NoSQL(Redis、RocksDB)、向量(Milvus、Qdrant)、圖(Neo4j、Nebula Graph)、大數(shù)據(jù)處理(Hadoop、Spark),具備良好的數(shù)據(jù)建模能力。
5. 深入理解數(shù)據(jù)庫內(nèi)核原理,包括存儲管理、查詢優(yōu)化器、事務(wù)與日志、多版本并發(fā)控制等。有參與或貢獻(xiàn)開源數(shù)據(jù)庫經(jīng)驗(yàn)者優(yōu)先。
6. 了解主流向量數(shù)據(jù)庫(Milvus、Weaviate、FAISS、Qdrant 等)并能進(jìn)行性能調(diào)優(yōu)。
7. 邏輯清晰,結(jié)果導(dǎo)向,具有良好的文檔編寫能力,具備跨團(tuán)隊(duì)溝通協(xié)作,熱愛探索學(xué)習(xí)前沿大模型應(yīng)用技術(shù);有生成式 AI 產(chǎn)品落地經(jīng)驗(yàn)者優(yōu)先。