1.工程化落地與性能調(diào)優(yōu)
o搭建大模型服務框架,熟悉HTTP接口設計,部署高并發(fā)、低延遲的模型服務。
o利用vLLM、Ollama等框架優(yōu)化推理性能,探索量化、蒸餾等技術(shù)壓縮模型規(guī)模。
o構(gòu)建模型評估體系,設計自動化評測腳本,監(jiān)控模型輸出穩(wěn)定性及安全性(如幻覺抑制)。
2.業(yè)務場景賦能
o與售前團隊協(xié)作,針對審計領域需求,設計大模型應用方案(如制度問答,審計問題定性,審計文書生成)。
o熟練運用工具鏈與中間件,例如LangChain、LlamaIndex等框架實現(xiàn)復雜任務編排,結(jié)合向量數(shù)據(jù)庫(如Milvus、Pinecone)優(yōu)化檢索效率。
3.大模型開發(fā)與優(yōu)化
o負責大語言模型(LLM)的預訓練、精調(diào)(SFT)、強化學習(RLHF)等流程開發(fā),優(yōu)化模型在問答、摘要、知識推理等場景的性能。
o應用LoRA、QLoRA等技術(shù)實現(xiàn)模型參數(shù)高效微調(diào),結(jié)合業(yè)務需求適配開源模型(如LLaMA、GLM、Qwen等),減少資源消耗并提升推理效率。
o設計并實施RAG(檢索增強生成)技術(shù)方案,優(yōu)化端到端鏈路效果,提升知識密集型任務準確率。
任職要求
1.技術(shù)能力
o精通Python,熟悉PyTorch/TensorFlow框架,具備分布式訓練及混合精度調(diào)優(yōu)經(jīng)驗者優(yōu)先。
o熟悉Prompt Engineering設計模式,具備多輪對話、角色扮演等交互式場景的調(diào)優(yōu)經(jīng)驗。
o熟悉大模型生態(tài)工具鏈,包括但不限于Hugging Face、LLaMA Factory等。
o熟悉Linux操作系統(tǒng),掌握基礎運維及性能調(diào)優(yōu)命令(如Shell腳本、資源監(jiān)控)
o理解網(wǎng)絡基礎(如HTTP協(xié)議、RESTful API設計、高并發(fā)服務架構(gòu)),具備服務部署及調(diào)試經(jīng)驗。
o熟悉數(shù)據(jù)庫技術(shù),包括關(guān)系型數(shù)據(jù)庫(如MySQL)和NoSQL數(shù)據(jù)庫(如MongoDB),了解向量數(shù)據(jù)庫的應用場景。
o了解前后端開發(fā)框架(如Django/Flask、React/Vue),能夠協(xié)作完成服務接口聯(lián)調(diào)及輕量化前端開發(fā)。
2.經(jīng)驗要求
o3年以上NLP/或1年以上大模型研發(fā)經(jīng)驗,完整參與過至少一個LLM項目的訓練或落地應用者優(yōu)先。
o有金融、政務、審計等領域AI項目經(jīng)驗者優(yōu)先。
o熟悉華為昇騰生態(tài)(如MindSpore、ModelArts)或云計算平臺集成經(jīng)驗者優(yōu)先。
o具備基于通用技術(shù)棧(如Linux服務器部署、數(shù)據(jù)庫優(yōu)化、前后端協(xié)作)的工程化落地經(jīng)驗者優(yōu)先
3.團隊能力素質(zhì)
o能力獨立實施大模型工程類項目者優(yōu)先。
o具備團隊協(xié)作能力,能將復雜技術(shù)問題轉(zhuǎn)化為可落地的業(yè)務解決方案者優(yōu)先。