職位描述
作為研發(fā)團隊的實習生,您將直接參與大模型相關(guān)的實驗與研發(fā)工作,協(xié)助算法工程師完成數(shù)
據(jù)處理、模型訓練與實驗復現(xiàn)。該崗位能夠讓您在真實的科研與工程場景中積累經(jīng)驗,并有機
會接觸最前沿的大模型與 RAG 系統(tǒng)應用。
主要職責
1.協(xié)助開展大模型的訓練與微調(diào)實驗,包括實驗環(huán)境搭建與結(jié)果復現(xiàn)。
2.參與數(shù)據(jù)收集、清洗、標注和預處理,保證訓練數(shù)據(jù)的準確性與完整性。
3.協(xié)助構(gòu)建和維護訓練集、驗證集與評估集,為模型迭代提供支持。
4.編寫實驗腳本與工具代碼,提升研發(fā)與測試的自動化程度。
5.撰寫實驗日志與結(jié)果報告,定期總結(jié)實驗經(jīng)驗。
6.協(xié)助開展檢索增強生成(RAG)系統(tǒng)的實驗,測試 embedding、檢索等模塊效果。
職位要求
1.本科或碩士在讀,計算機科學、人工智能、數(shù)學、統(tǒng)計等相關(guān)專業(yè)。
2.熟悉 Python 編程,掌握 NumPy、Pandas 等數(shù)據(jù)處理工具。
3.了解 PyTorch 或 TensorFlow 框架,能夠運行基礎(chǔ)實驗。
4.學習能力強,能夠快速掌握新技術(shù)。
5.具備團隊合作精神與良好的溝通能力。
6.每周可實習不少于 4 天,能持續(xù) 3 個月以上。
加分項
1.有科研項目、開源貢獻或算法競賽經(jīng)歷。
2.熟悉 HuggingFace Transformers、LangChain、LlamaIndex 等開源框架。
3.有實際的大模型微調(diào)、數(shù)據(jù)處理或應用開發(fā)經(jīng)驗。
4.在學術(shù)會議/期刊發(fā)表過論文,或在 GitHub 有相關(guān)項目成果