崗位職責(zé):
1、深入跟蹤調(diào)研大模型等AI技術(shù)的前沿動態(tài),研究制定AI新技術(shù)在本公司相關(guān)領(lǐng)域內(nèi)的實施方案,牽頭推進核心代碼的研發(fā)和實施;
2、深入研究大模型相關(guān)的技術(shù),分析不同模型和方案的優(yōu)劣勢,評估最合適的技術(shù)方案;熟悉大模型技術(shù)解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評測等;利用框架(例如Langchain/LangGraph等)開發(fā)基于大模型的智能體(Agent)和檢索增強生成技術(shù)(RAG)相關(guān)的產(chǎn)品,參與大模型應(yīng)用平臺、RAG知識庫平臺等項目落地;使用pretrain、 PEFT、SFT、RLHF 等大模型優(yōu)化技術(shù),深度優(yōu)化場景問題中的大模型效果;使用數(shù)據(jù)去噪、知識增強、知識外掛等技術(shù),緩解或消除業(yè)務(wù)應(yīng)用中的大模型幻覺現(xiàn)象;基于大模型技術(shù)構(gòu)應(yīng)用服務(wù),解決業(yè)務(wù)中的場景問題。
3、根據(jù)大模型場景應(yīng)用,進行大模型應(yīng)用平臺的關(guān)鍵代碼開發(fā)和系統(tǒng)調(diào)優(yōu)。
任職要求:
1.計算機、數(shù)學(xué)或統(tǒng)計學(xué)相關(guān)專業(yè),精通Python、Java等開發(fā)語言,精通 pytorch、tensorflow 等至少1種深度學(xué)習(xí)框架,具有3年以上 NLP 相關(guān)工作經(jīng)驗;
2.熟悉大模型技術(shù)解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評測等;
3.精通 attention、transformer 及其變型,能熟練應(yīng)用預(yù)訓(xùn)練、PEFT、SFT、 RLHF 等各種優(yōu)化技術(shù);
4.熟悉業(yè)界領(lǐng)先的大模型系列,包括但不限于Deepseek、GPT、LLaMA、GLM、qwen等,對DeepSpeed、Megatron有一定了解和使用經(jīng)驗;