崗位職責
1. 模型選型與評估: 深入研究、評估和選型適用于特定業(yè)務場景(尤其關注知識利用能力)的開源和商用大語言模型(DeepSeek, Llama, ChatGLM, GPT系列等)。
2. 模型微調(SFT/RLHF): 設計并實施監(jiān)督微調和基于人類反饋的強化學習策略,優(yōu)化模型在結合外部知識(RAG上下文)后的回答準確性、可靠性、穩(wěn)定性和風格一致性。
3. 提示工程(Prompt Engineering)優(yōu)化: 針對RAG場景,設計、開發(fā)和優(yōu)化提示詞模板和策略,高效地將檢索到的知識整合到模型生成過程中,提升最終答案質量。
4. 模型推理與性能優(yōu)化: 優(yōu)化模型的推理效率和服務部署,關注模型在知識注入后的推理行為。
5. 協(xié)同知識利用: 與知識圖譜工程師和數(shù)據(jù)工程師緊密合作,理解知識表示和檢索方式,為模型設計最佳的知識接入和利用機制。與數(shù)據(jù)工程師合作定義模型訓練/微調所需的數(shù)據(jù)規(guī)格。
6. 前沿技術跟蹤: 持續(xù)跟蹤大模型訓練、微調(SFT/RLHF)、提示工程、推理優(yōu)化等領域的最新進展。
任職要求
1. AI技術棧:
深入理解主流LLMs架構、訓練/微調原理及應用場景。
精通大模型微調技術(SFT, RLHF, PPO, DPO等)及其工程實踐。
精通提示工程(Prompt Engineering)技術,尤其在結合檢索結果(RAG Context)進行回答生成時的優(yōu)化技巧。
熟悉Langchain/LlamaIndex等框架在模型集成與調用方面的應用。
經(jīng)驗要求:
2年以上大模型應用、微調(特別是SFT/RLHF)或訓練經(jīng)驗。
有成功應用或優(yōu)化LLM于復雜任務(特別是需要外部知識的任務)的項目經(jīng)驗。
具備模型性能調優(yōu)和推理優(yōu)化的經(jīng)驗。
2. 核心技能:
模型評估與選型能力。
強大的模型微調(SFT/RLHF)工程能力。
高級提示工程(Prompt Engineering)能力(RAG場景重點)。
模型推理優(yōu)化能力。