職位描述
崗位職責(zé):
1、負(fù)責(zé)Agent系統(tǒng)的穩(wěn)定性建設(shè),設(shè)計(jì)高可用架構(gòu)與容災(zāi)降級(jí)方案,保障系統(tǒng)在極端場(chǎng)景下穩(wěn)定運(yùn)行;
2、優(yōu)化系統(tǒng)性能,解決分布式場(chǎng)景下的任務(wù)調(diào)度、數(shù)據(jù)一致性、故障自愈等挑戰(zhàn),提升服務(wù)SLA;
3、建立系統(tǒng)監(jiān)控、告警及應(yīng)急響應(yīng)機(jī)制,負(fù)責(zé)重大故障的排查與恢復(fù);
4、持續(xù)優(yōu)化系統(tǒng)架構(gòu),通過(guò)代碼重構(gòu)、性能調(diào)優(yōu)等手段提升系統(tǒng)擴(kuò)展性與可維護(hù)性;
5、探索分布式計(jì)算、任務(wù)調(diào)度、流式數(shù)據(jù)處理等領(lǐng)域的前沿技術(shù)(如分布式事務(wù)、彈性擴(kuò)縮容、異構(gòu)計(jì)算等),推動(dòng)技術(shù)成果轉(zhuǎn)化。
任職要求:
1、本科及以上學(xué)歷,計(jì)算機(jī)、通訊等相關(guān)專業(yè),5年及以上研發(fā)相關(guān)工作經(jīng)驗(yàn)優(yōu)先;
2、扎實(shí)的計(jì)算機(jī)知識(shí),有較強(qiáng)的邏輯能力和學(xué)習(xí)能力;深入了解Go、Python、Java等至少一門語(yǔ)言;
3、熟悉分布式系統(tǒng)設(shè)計(jì)、微服務(wù)系統(tǒng)設(shè)計(jì)、穩(wěn)定性治理、常用中間件原理以及實(shí)踐等優(yōu)先;
4、在系統(tǒng)容災(zāi)(多活架構(gòu)、流量調(diào)度)、服務(wù)降級(jí)(熔斷限流)、性能優(yōu)化(JVM/網(wǎng)絡(luò)/存儲(chǔ))等領(lǐng)域有成功落地經(jīng)驗(yàn);
5、有AI/Agent系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn),熟悉LLM、RAG、分布式模型推理等技術(shù)棧的優(yōu)先;
6、熱愛(ài)技術(shù),主動(dòng)負(fù)責(zé),樂(lè)于直面挑戰(zhàn);能夠保持開(kāi)放、持續(xù)學(xué)習(xí),善于發(fā)現(xiàn)問(wèn)題,具備良好的團(tuán)隊(duì)合作精神;有良好的代碼編程風(fēng)格。