崗位職責(zé):
1. 負(fù)責(zé)智能座艙大模型應(yīng)用開(kāi)發(fā),基于 Python/C++/Java/Rust 完成大模型推理服務(wù)、Agent 編排、RAG 檢索增強(qiáng)、多模態(tài)交互(語(yǔ)音/視覺(jué)/觸控)等功能的設(shè)計(jì)與實(shí)現(xiàn);
2. 參與座艙大模型軟件架構(gòu)設(shè)計(jì)與優(yōu)化,靈活運(yùn)用 Transformer、LoRA/QLoRA等算法,結(jié)合 LangGraph/LangChain 編排框架及 插件化/微服務(wù)架構(gòu),提升系統(tǒng)可維護(hù)性與擴(kuò)展性;
3. 實(shí)現(xiàn)高性能端云協(xié)同推理,熟悉 TensorRT-LLM、vLLM、ONNX Runtime、SgLang 等加速框架,支持 GPU/NPU 混合調(diào)度與量化部署,確保低延遲、高并發(fā)體驗(yàn);
4.負(fù)責(zé)跨平臺(tái)集成與調(diào)試,掌握 Linux/QNX 環(huán)境下的容器化部署(Docker/K8s)、模型熱更新、性能監(jiān)控與異?;謴?fù)機(jī)制;
5. 設(shè)計(jì)多線程/異步任務(wù)與進(jìn)程間通信機(jī)制,保障大模型服務(wù)在車載環(huán)境下的穩(wěn)定性與實(shí)時(shí)性;
6. 負(fù)責(zé) A2A(Agent2Agent)協(xié)議與 MCP(Model Context Protocol) 的集成開(kāi)發(fā),支持座艙內(nèi)多智能體協(xié)作與工具調(diào)用,熟悉 Function Call、Tool Schema、Agent Card 等規(guī)范;
7. 負(fù)責(zé)向量數(shù)據(jù)庫(kù)(如 Milvus/Chroma)與大模型記憶系統(tǒng)集成,支持長(zhǎng)期記憶、個(gè)性化推薦與上下文召回;
8. 負(fù)責(zé)接口封裝(RESTful/gRPC/WebSocket)與 SDK 開(kāi)發(fā),向下對(duì)接車控、導(dǎo)航、娛樂(lè)等車載服務(wù),向上為前端應(yīng)用提供標(biāo)準(zhǔn)化模型調(diào)用接口;
9. 負(fù)責(zé)大模型微調(diào)(SFT、DPO、RLHF),基于 DeepSpeed/LLamaFactory/Unsloth/HuggingFaceTransformers 等工具鏈,利用座艙場(chǎng)景數(shù)據(jù)優(yōu)化指令遵循、多輪對(duì)話與工具調(diào)用能力;
9. 支持團(tuán)隊(duì)協(xié)作開(kāi)發(fā)與版本管理,熟練使用 Git、CI/CD、MLOps 工具鏈,保障大模型應(yīng)用的高質(zhì)量交付與持續(xù)迭代。"
任職要求:
軟件工程,計(jì)算機(jī)類,電子信息類,自動(dòng)化類,通信類等相關(guān)專業(yè);
0;
1年以上相關(guān)領(lǐng)域工作經(jīng)驗(yàn),有大模型平臺(tái)相關(guān)量產(chǎn)經(jīng)驗(yàn)優(yōu)先。;
1.熟練掌握至少一種后端開(kāi)發(fā)語(yǔ)言,如 Python、Java、Go 等,能夠高效地實(shí)現(xiàn)復(fù)雜的業(yè)務(wù)邏輯和系統(tǒng)功能;
2.熟悉大模型開(kāi)源框架和工具:LangChain、LlamaIndex等;
3.熟練掌握Caffe/TensorFlow/Pytorch/MACE/MNN/NCNN等至少一種深度學(xué)習(xí)框架,對(duì)深度學(xué)習(xí)模型有一定了解;
4.熟練使用容器化技術(shù);
5.熟悉 HTTP、HTTPS、WebSocket 等網(wǎng)絡(luò)協(xié)議,能夠進(jìn)行高效的網(wǎng)絡(luò)請(qǐng)求和數(shù)據(jù)傳輸;
6.熟悉常見(jiàn)的云端服務(wù)提供商(如 AWS、Azure、阿里云等)的產(chǎn)品和服務(wù),能夠根據(jù)項(xiàng)目需求選擇合適的云端技術(shù)棧。;
具備較強(qiáng)的組織、計(jì)劃和溝通能力;
具備較強(qiáng)的自信心及靈活應(yīng)變能力;
了解汽車智能網(wǎng)聯(lián)發(fā)展趨勢(shì),掌握行業(yè)發(fā)展動(dòng)態(tài)。;