崗位職責(zé):
1、大模型開發(fā)與調(diào)優(yōu)。基于DeepSeek大模型進行垂直領(lǐng)域適配,完成模型訓(xùn)練、微調(diào)(LoRA/P-Tuning)及性能優(yōu)化;設(shè)計知識庫驅(qū)動的高效訓(xùn)練方案,解決幻覺問題并提升專業(yè)領(lǐng)域輸出準(zhǔn)確性(如醫(yī)療術(shù)語合規(guī)性);
2、知識庫工程化。構(gòu)建多模態(tài)行業(yè)知識庫(文本/表格/圖譜),開發(fā)數(shù)據(jù)清洗-向量化-檢索增強(RAG)全流程工具鏈。設(shè)計混合檢索策略(關(guān)鍵詞+語義),實現(xiàn)知識庫與模型的動態(tài)對齊,支持實時增量更新;
3、智能體系統(tǒng)開發(fā)。開發(fā)基于DeepSeek的智能體框架,實現(xiàn)多輪對話、任務(wù)規(guī)劃及工具調(diào)用(API/數(shù)據(jù)庫)能力;搭建評估體系,通過人工評估+A/B測試持續(xù)優(yōu)化意圖識別與響應(yīng)質(zhì)量
4、工程部署與優(yōu)化。完成模型量化(GPTQ/AWQ)、蒸餾及本地化部署,確保低資源場景下的推理效率(RTF<0.3);設(shè)計監(jiān)控方案,跟蹤GPU利用率/顯存占用等關(guān)鍵指標(biāo),實現(xiàn)成本可控的模型服務(wù)。
任職要求:
1、熟練掌握PyTorch/TensorFlow框架,3年以上NLP實戰(zhàn)經(jīng)驗,至少1個大模型落地項目經(jīng)歷;
2、精通DeepSeek模型架構(gòu),有RLHF/DPO等對齊技術(shù)實踐經(jīng)驗,掌握LangChain/LLamaIndex等開發(fā)工具;
3、深入理解檢索增強(RAG)、提示工程、Agent開發(fā)等關(guān)鍵技術(shù)點
4、具備知識圖譜構(gòu)建經(jīng)驗,熟悉Neo4j/TigerGraph等工具,能設(shè)計Schema與抽取規(guī)則;
5、熟練使用Docker/K8s進行模型服務(wù)化部署,有 Triton推理服務(wù)器優(yōu)化經(jīng)驗者優(yōu)先。