崗位職責(zé):
1.負(fù)責(zé)大模型的應(yīng)用開發(fā)、微調(diào)和優(yōu)化。
2.根據(jù)業(yè)務(wù)需求,設(shè)計(jì)和實(shí)現(xiàn)基于大模型的解決方案,如文本生成、對(duì)話系統(tǒng)、知識(shí)問答等。
3.開發(fā)基于大模型的知識(shí)庫構(gòu)建、檢索增強(qiáng)生成系統(tǒng)及相關(guān)應(yīng)用。
4.研究并探索大模型在不同業(yè)務(wù)場(chǎng)景中的創(chuàng)新性應(yīng)用。
5.與產(chǎn)品、數(shù)據(jù)團(tuán)隊(duì)協(xié)作,完成模型部署和效果評(píng)估
任職要求:
1.學(xué)歷要求:計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷。
2.工作經(jīng)驗(yàn):3年以上機(jī)器學(xué)習(xí)/深度學(xué)習(xí)相關(guān)經(jīng)驗(yàn),1年以上大模型應(yīng)用或微調(diào)經(jīng)驗(yàn)。
3.技術(shù)要求:
(1)熟悉深度學(xué)習(xí)框架(如PyTorch、TensorFlow),具備扎實(shí)的編程能力(Python為主);
(2)熟悉常見的大模型架構(gòu)(如Transformer、GPT、BERT等),了解其原理和實(shí)現(xiàn)細(xì)節(jié);
(3)具備大模型微調(diào)經(jīng)驗(yàn),熟悉LoRA.P-Tuning、Adapter等微調(diào)技術(shù);
(4)熟悉提示工程(Prompt Engineering)和少樣本學(xué)習(xí)(Few-shot Learning);
(5)熟悉大模型的推理優(yōu)化技術(shù),如量化、剪枝、蒸餾等技術(shù),能夠優(yōu)化模型性能并降低資源消耗。
(6)熟悉常見的NLP任務(wù),如文本分類、命名實(shí)體識(shí)別、文本生成、對(duì)話系統(tǒng)等;
(9)熟練使用Java或Python開發(fā)服務(wù)端應(yīng)用。