崗位職責(zé):
1. 大模型服務(wù)能力建設(shè)
設(shè)計實(shí)現(xiàn)統(tǒng)一的大模型調(diào)用框架,支持上下文控制,流式響應(yīng),函數(shù)調(diào)用,多模型接入等服務(wù)能力,提示系統(tǒng)復(fù)用性及擴(kuò)展性。
2. 知識庫檢索及管理系統(tǒng)建設(shè)
負(fù)責(zé)知識庫入庫,向量化檢索,召回排序等模塊的開發(fā)與優(yōu)化,提升RAG相關(guān)任務(wù)的響應(yīng)準(zhǔn)確性和穩(wěn)定性。
3. 本地模型的部署與推理服務(wù)搭建
參與本地大模型(如Qwen、BaiChuan、Llama)推理框架部署、接口封裝、性能調(diào)優(yōu)等,提升系統(tǒng)自主可控性。
4. 任務(wù)流程與工作流編排設(shè)計
構(gòu)建AI任務(wù)流程及工作流。確保任務(wù)流程和工作流可以作為插件調(diào)用。支持多輪對話及條件分支,確保AI項(xiàng)目敏捷性及服務(wù)業(yè)務(wù)彈性需求。
5. 通用平臺能力建設(shè)
推動文本處理、權(quán)限控制、調(diào)用日志、用戶配置等模塊平臺化,沉淀通用組件,支撐跨場景能力復(fù)用。
任職要求:
1. 本科及以上學(xué)歷,計算機(jī)、軟件工程或相關(guān)專業(yè),3年以上Node.js / Python后端開發(fā)經(jīng)驗(yàn);
2. 具有創(chuàng)新精神,熟悉、理解Agentic workflows和AI agent的架構(gòu)、模式及其區(qū)別和合適的應(yīng)用場景,有意愿深入結(jié)合業(yè)務(wù)流程,實(shí)施最佳實(shí)踐方案;
3. 精通Node.js(Express/NestJS)和Python(FastAPI、Flask)生態(tài),能獨(dú)立完成高質(zhì)量API 和微服務(wù)開發(fā);
4. 熟悉大模型推理框架(VLLM、SGLANG、系列),具備實(shí)際應(yīng)用開發(fā)經(jīng)驗(yàn);
5. 掌握FastGPT 或 LangChain 等 RAG 框架,了解知識庫、向量數(shù)據(jù)庫和檢索增強(qiáng)技術(shù);
6. 具備云端AI平臺(SageMaker、Vertex AI 等)上的部署和生命周期管理經(jīng)驗(yàn);
7. 了解微服務(wù)架構(gòu)、容器化(Docker/Kubernetes)和性能優(yōu)化;
8. 有較強(qiáng)的自驅(qū)力和溝通協(xié)作能力,能在已有中間件架構(gòu)基礎(chǔ)上主導(dǎo)AI 應(yīng)用開發(fā)。