崗位描述:
聚焦大模型功能與性能,重點針對AI記憶功能設計貼合實際應用場景的評估方案與測試邏輯,開展全面的效果評估工作,輸出客觀、詳實的評估結(jié)果
深入思考大模型的應用價值與用戶需求匹配度,基于評估數(shù)據(jù)提出針對性的優(yōu)化建議,助力模型迭代升級,確保模型改進符合預期目標
與上游技術團隊保持密切溝通,清晰傳遞評估中發(fā)現(xiàn)的問題與用戶視角的反饋,協(xié)同推進模型優(yōu)化,共同提升產(chǎn)品體驗
整理分析評估過程中的各類數(shù)據(jù),形成系統(tǒng)性的評估報告,為模型迭代提供決策支持,同時關注模型使用中的安全合規(guī)性相關問題
參與團隊關于大模型的業(yè)務規(guī)劃討論,結(jié)合評估經(jīng)驗提出建設性意見,助力團隊目標達成
崗位要求:
本科及以上學歷,擁有三年以上互聯(lián)網(wǎng)相關工作經(jīng)驗優(yōu)先,具備扎實的邏輯思維能力與數(shù)據(jù)分析意識
對大模型有濃厚興趣,具備獨立思考能力,能從用戶角度分析模型的優(yōu)勢與不足,有AI項目交付經(jīng)驗者優(yōu)先;
能準確理解業(yè)務訴求,對質(zhì)量/數(shù)據(jù)變化敏銳,能通過獨到的視角或科學的方法發(fā)現(xiàn)問題,推動業(yè)務指標達成和策略落地;
積極主動,對AI有激情,具備較強的團隊協(xié)作能力、組織協(xié)調(diào)能力、復雜問題解決能力;
樂于接受新理念,能夠適應較快工作節(jié)奏,有很好的自我驅(qū)動性,對科技感興趣愿意鉆研