任職要求:
1.計算機科學/人工智能相關(guān)專業(yè)本科及以上學歷:
2.精通Pytlhon語言,熟悉使用FastAPI、Flask、Django任一框架;
3.熟悉Linuux并發(fā)環(huán)境.熟練使用Git等協(xié)作工具。
4.2年以上NLP算法開發(fā)應(yīng)用經(jīng)驗,熟悉Transformer、BERT、GPT等模型原理及調(diào)優(yōu)方法:
5.惡大模型部署工具鏈(Xinference/Ollama/vLLM),有實際部署通義午尚、DeepSeek等模型經(jīng)驗。
6.熟悉LangChain/Dify等應(yīng)用框架,具備工作流編排與FunctionCalling開發(fā)經(jīng)驗:
7.熟練使用Docker實現(xiàn)模型服務(wù)容器化,了解CI/CD流程及K8s生態(tài):
8.加分項: 1:具有數(shù)據(jù)開發(fā)相關(guān)經(jīng)驗,熟悉數(shù)據(jù)開發(fā)任務(wù),包括但不限于報表生成、ETL流程的調(diào)度和優(yōu)化、在LLM應(yīng)用創(chuàng)新(RAG/Agent)方向有落地案例。
崗位職責
1.負責大語言模型(LLM)的本地化部署、性能優(yōu)化及推理加速,熟練使用Xinference、Olama、VLLM等框架進行模型服務(wù)化:確保模型在生產(chǎn)環(huán)境中的穩(wěn)定運行和高性能表現(xiàn)。
2基于LangChain、Diffy等框架開發(fā)大模型應(yīng)用設(shè)計并實現(xiàn)復雜工作流編排與FuncticonCalling應(yīng)用;
3.負責知識庫的構(gòu)建及優(yōu)化任務(wù),