【工作職責】
基于業(yè)務場景需求,分析大模型應用的技術(shù)路徑,設計針對性微調(diào)方案與評估體系。
基于大模型微調(diào)框架,完成模型參數(shù)調(diào)優(yōu)、領(lǐng)域適配及性能優(yōu)化,提升模型任務表現(xiàn)。
構(gòu)建高質(zhì)量訓練數(shù)據(jù)集,設計數(shù)據(jù)增強策略,開發(fā)數(shù)據(jù)清洗與標注工具鏈。
搭建模型評估平臺,設計多維度測試用例,持續(xù)監(jiān)控并優(yōu)化模型推理效果。
研究模型蒸餾、量化、加速等技術(shù),推動大模型在具體業(yè)務場景的工程化落地。
【任職要求】
計算機、人工智能相關(guān)專業(yè)碩士及以上學歷,3年以上NLP、深度學習研發(fā)經(jīng)驗。
深入理解Transformer架構(gòu),熟悉BERT、GPT、DeepSeek等主流大模型的技術(shù)原理與實現(xiàn)細節(jié)。
掌握PyTorch、TensorFlow等框架,具備分布式訓練實戰(zhàn)經(jīng)驗。
精通Prompt工程、LoRA、P-tuning等微調(diào)技術(shù),具有多任務遷移學習項目經(jīng)驗。
熟悉HuggingFace生態(tài),具備完整的大模型訓練-評估-部署全鏈路開發(fā)能力。
具備優(yōu)秀的數(shù)據(jù)處理能力,熟悉SQL/NoSQL數(shù)據(jù)庫及大數(shù)據(jù)處理框架。
對模型安全、可解釋性有深入理解,具有大模型對齊經(jīng)驗者優(yōu)先。