崗位職責:
1、大模型開發(fā)與調(diào)優(yōu)?;贒eepSeek大模型進行垂直領域適配,完成模型訓練、微調(diào)(LoRA/P-Tuning)及性能優(yōu)化;設計知識庫驅(qū)動的高效訓練方案,解決幻覺問題并提升專業(yè)領域輸出準確性(如醫(yī)療術語合規(guī)性);
2、知識庫工程化。構建多模態(tài)行業(yè)知識庫(文本/表格/圖譜),開發(fā)數(shù)據(jù)清洗-向量化-檢索增強(RAG)全流程工具鏈。設計混合檢索策略(關鍵詞+語義),實現(xiàn)知識庫與模型的動態(tài)對齊,支持實時增量更新;
3、智能體系統(tǒng)開發(fā)。開發(fā)基于DeepSeek的智能體框架,實現(xiàn)多輪對話、任務規(guī)劃及工具調(diào)用(API/數(shù)據(jù)庫)能力;搭建評估體系,通過人工評估+A/B測試持續(xù)優(yōu)化意圖識別與響應質(zhì)量
4、工程部署與優(yōu)化。完成模型量化(GPTQ/AWQ)、蒸餾及本地化部署,確保低資源場景下的推理效率(RTF<0.3);設計監(jiān)控方案,跟蹤GPU利用率/顯存占用等關鍵指標,實現(xiàn)成本可控的模型服務。
任職要求:
1、熟練掌握PyTorch/TensorFlow框架,3年以上NLP實戰(zhàn)經(jīng)驗,至少1個大模型落地項目經(jīng)歷;
2、精通DeepSeek模型架構,有RLHF/DPO等對齊技術實踐經(jīng)驗,掌握LangChain/LLamaIndex等開發(fā)工具;
3、深入理解檢索增強(RAG)、提示工程、Agent開發(fā)等關鍵技術點
4、具備知識圖譜構建經(jīng)驗,熟悉Neo4j/TigerGraph等工具,能設計Schema與抽取規(guī)則;
5、熟練使用Docker/K8s進行模型服務化部署,有 Triton推理服務器優(yōu)化經(jīng)驗者優(yōu)先。