崗位職責:
1.前沿技術追蹤與落地:持續(xù)跟蹤LLM、多模態(tài)、 Al Agent等領域的最新技術動態(tài)(如GPT系列、 DeepSeek系列、Claude系列、Sora等),并結合業(yè)務場景進行快速驗證和應用。
2.模型微調與對齊:負責大模型的監(jiān)督微調
(SFT)、指令微調,以及基于人類/AI反饋的強化學習(RLHF/RLAIF)、直接偏好優(yōu)化(DPO)等對齊技術,提升模型在特定任務上的表現(xiàn)。
3.RAG與智能體(Agent)開發(fā):設計和優(yōu)化檢索增強生成(RAG)流程,結合向量數(shù)據(jù)庫、知識圖譜等技術,減少模型幻覺,提升回答的準確性。構建和開發(fā)能夠使用工具、進行復雜任務規(guī)劃的AI智能體。
4.多模態(tài)能力構建:負責文本、圖像、音頻、視頻等多模態(tài)大模型的研發(fā)和應用工作,包括但不限于多模態(tài)內容理解、生成和跨模態(tài)檢索。
5.性能優(yōu)化與部署:負責大模型的推理性能優(yōu)化,包括量化、蒸餾、剪枝等模型壓縮技術,并使用 vLLM、TensorRT-LLM等先進框架進行高效部署,降低服務成本。
6.評估體系建設:設計并建立一套科學、全面的模型評估體系,從準確性、流暢性、安全性等多個維度對模型能力進行持續(xù)、客觀的評測。
任職要求
1.計算機科學、人工智能、電子工程、數(shù)學或相關領域的碩士研究生學歷。
2.3年以上AI算法研發(fā)經驗,至少1年以上大模型(LLM)相關的項目實戰(zhàn)經驗,環(huán)保相關領域。
3.精通Python編程,熟練掌握至少一種主流深度學習框架(PyTorch優(yōu)先,TensorFlow亦可)。
4.具備豐富的大模型微調(SFT,LoRA,QLoRA等)和對齊(RLHF, DPO)實踐經驗。
5.熟悉RAG技術棧,有向量數(shù)據(jù)庫(如Milvus, Pinecone.Chroma)的使用經驗.