崗位職責(zé):
1、模型服務(wù)化與部署:主導(dǎo)大模型(LLM)的服務(wù)化開發(fā),設(shè)計(jì)高性能、可擴(kuò)展的模型API服務(wù),支持高并發(fā)、低延遲的在線推理需求。
優(yōu)化模型部署方案(如容器化/Docker、Kubernetes、模型量化剪枝),解決顯存管理、動(dòng)態(tài)負(fù)載均衡等工程問題。
構(gòu)建模型監(jiān)控體系,跟蹤服務(wù)性能(如吞吐量、錯(cuò)誤率)及業(yè)務(wù)指標(biāo)(如AI輸出準(zhǔn)確率)。
2、跨系統(tǒng)集成指導(dǎo):主導(dǎo)AI能力與現(xiàn)有軟件系統(tǒng)(如ERP、CRM、OA)、數(shù)據(jù)平臺(tái)(數(shù)據(jù)湖/數(shù)倉)及業(yè)務(wù)流程的集成,設(shè)計(jì)標(biāo)準(zhǔn)化接口規(guī)范。
針對(duì)復(fù)雜業(yè)務(wù)場(chǎng)景(如智能客服、自動(dòng)化報(bào)告生成),設(shè)計(jì)端到端AI解決方案,協(xié)調(diào)前后端、數(shù)據(jù)團(tuán)隊(duì)完成聯(lián)調(diào)。
制定數(shù)據(jù)流轉(zhuǎn)方案,確保輸入輸出數(shù)據(jù)與業(yè)務(wù)系統(tǒng)兼容(如結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換、非結(jié)構(gòu)化文本處理)。
基本要求:
1、3年以上AI工程化經(jīng)驗(yàn),至少主導(dǎo)過1個(gè)以上AI系統(tǒng)集成項(xiàng)目(如將大模型嵌入企業(yè)工作流)。
2、精通Python。
3、本科及以上學(xué)歷。
加分項(xiàng):
1、具備跨團(tuán)隊(duì)協(xié)作經(jīng)驗(yàn),能撰寫技術(shù)方案書并面向非技術(shù)角色宣講。
2、有LLM應(yīng)用中間件開發(fā)經(jīng)驗(yàn)(如流量控制、緩存機(jī)制、審計(jì)日志)。