【職位概述】
作為我們學(xué)院AI算力與創(chuàng)新生態(tài)的核心運(yùn)營(yíng)者,您將肩負(fù)起規(guī)劃、推動(dòng)和管理學(xué)院核心算力基礎(chǔ)設(shè)施與關(guān)鍵技術(shù)項(xiàng)目的重任。您需要深度鏈接前沿學(xué)術(shù)研究與先進(jìn)計(jì)算資源,通過(guò)卓越的項(xiàng)目管理、高效的資源協(xié)調(diào)和清晰的戰(zhàn)略規(guī)劃,確保算力平臺(tái)穩(wěn)定高效運(yùn)行,并全力支撐學(xué)院內(nèi)科學(xué)家、研究員、學(xué)生及合作伙伴的科研創(chuàng)新與項(xiàng)目落地。您是技術(shù)專家、項(xiàng)目經(jīng)理和業(yè)務(wù)伙伴的三重角色融合者,是推動(dòng)學(xué)院人工智能領(lǐng)域發(fā)展的關(guān)鍵引擎。
【主要職責(zé)】
1.算力與數(shù)據(jù)平臺(tái)戰(zhàn)略與全生命周期管理:
?規(guī)劃與設(shè)計(jì):牽頭制定學(xué)院AI算力平臺(tái)(如GPU集群)、數(shù)據(jù)平臺(tái)的長(zhǎng)期技術(shù)發(fā)展路線圖與資源規(guī)劃,確保其技術(shù)先進(jìn)性與資源充足性,滿足學(xué)院日益增長(zhǎng)的科研需求。
?項(xiàng)目管控:全面負(fù)責(zé)算力平臺(tái)開(kāi)發(fā)、升級(jí)、擴(kuò)容項(xiàng)目的計(jì)劃制定、預(yù)算編制、資源協(xié)調(diào)、進(jìn)度跟蹤、風(fēng)險(xiǎn)識(shí)別與質(zhì)量把控,確保項(xiàng)目按時(shí)高質(zhì)量交付。
?運(yùn)營(yíng)優(yōu)化:監(jiān)控平臺(tái)運(yùn)行狀態(tài)與資源利用率,持續(xù)優(yōu)化調(diào)度策略,提升算力使用效率與成本效益。負(fù)責(zé)處理平臺(tái)運(yùn)行中的重大故障與應(yīng)急事件。
2.科研需求對(duì)接與生態(tài)合作賦能:
?需求挖掘:主動(dòng)與學(xué)院的科學(xué)家、研究團(tuán)隊(duì)、博士生及博士后等進(jìn)行溝通,深入理解其研究項(xiàng)目對(duì)算力、數(shù)據(jù)和工具鏈的具體需求,提供技術(shù)解決方案咨詢。
?客戶成功:作為主要技術(shù)接口人,對(duì)接合作企業(yè),理解其聯(lián)合研發(fā)或技術(shù)合作需求,確保算力資源能有效支撐產(chǎn)業(yè)合作項(xiàng)目的實(shí)施與交付。
?社區(qū)建設(shè):組織技術(shù)培訓(xùn)、工作坊和分享會(huì),提升學(xué)院師生對(duì)算力平臺(tái)的使用能力,構(gòu)建活躍的技術(shù)交流社區(qū)。
3.技術(shù)項(xiàng)目管理體系與標(biāo)準(zhǔn)化建設(shè):
?流程制定:建立并完善學(xué)院級(jí)技術(shù)項(xiàng)目的立項(xiàng)、評(píng)審、執(zhí)行、結(jié)項(xiàng)全流程管理規(guī)范與標(biāo)準(zhǔn),引入最佳實(shí)踐(如Agile,DevOps)。
?質(zhì)量與效能提升:通過(guò)工具化、自動(dòng)化手段,優(yōu)化項(xiàng)目管理流程,提升跨團(tuán)隊(duì)協(xié)作效率。建立項(xiàng)目評(píng)估體系,定期復(fù)盤(pán),持續(xù)提升項(xiàng)目交付質(zhì)量和成功率。
?知識(shí)管理:推動(dòng)項(xiàng)目文檔、技術(shù)資產(chǎn)的沉淀與共享,形成學(xué)院的知識(shí)庫(kù)。
4.跨團(tuán)隊(duì)協(xié)同與資源整合:
?協(xié)同基礎(chǔ)設(shè)施團(tuán)隊(duì)、研發(fā)工程師、科研團(tuán)隊(duì)及外部供應(yīng)商,形成高效協(xié)作機(jī)制,確保項(xiàng)目目標(biāo)一致、信息暢通。
?高效協(xié)調(diào)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源,優(yōu)先保障重點(diǎn)科研項(xiàng)目的需求,實(shí)現(xiàn)資源的最優(yōu)配置。
【任職要求】
必備條件:
1.教育背景:碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、軟件工程、人工智能、電子工程或相關(guān)領(lǐng)域。
2.行業(yè)經(jīng)驗(yàn):擁有3年以上人工智能、高性能計(jì)算(HPC)、云計(jì)算或大型系統(tǒng)集成領(lǐng)域的技術(shù)項(xiàng)目管理經(jīng)驗(yàn),深刻理解AI模型訓(xùn)練、推理對(duì)算力資源的需求特點(diǎn)。
3.項(xiàng)目管理能力:精通項(xiàng)目管理方法論(如PMP/Prince2/Agile),具備出色的多項(xiàng)目并行管理能力,能從復(fù)雜需求中厘清優(yōu)先級(jí),并以結(jié)果為導(dǎo)向推動(dòng)項(xiàng)目落地。
4.技術(shù)理解力:對(duì)GPU計(jì)算、分布式存儲(chǔ)、容器化技術(shù)(Docker/Kubernetes)、云原生體系有扎實(shí)的理解,能與技術(shù)團(tuán)隊(duì)進(jìn)行深度對(duì)話。
5.溝通協(xié)調(diào)能力:具備極強(qiáng)的人際溝通、協(xié)調(diào)和推動(dòng)能力,能夠高效地與不同背景的stakeholders(科研人員、學(xué)生、企業(yè)伙伴、管理層)進(jìn)行溝通,并達(dá)成共識(shí)。
6.結(jié)果導(dǎo)向:強(qiáng)烈的責(zé)任心和自驅(qū)力,以達(dá)成項(xiàng)目目標(biāo)和支持科研成功為最終工作成果的衡量標(biāo)準(zhǔn)。
【優(yōu)先考慮】
?擁有在科研院所、高校或大型科技企業(yè)算力平臺(tái)部門(mén)的項(xiàng)目管理或運(yùn)營(yíng)經(jīng)驗(yàn)。
?有實(shí)際參與過(guò)AI算力平臺(tái)(如NVIDIADGX集群,Kubernetes調(diào)度等)建設(shè)或運(yùn)營(yíng)經(jīng)驗(yàn)者。
?對(duì)主流AI框架(如TensorFlow,PyTorch)和機(jī)器學(xué)習(xí)運(yùn)維(MLOps)有實(shí)踐經(jīng)驗(yàn)者。
?持有PMP、ACP、CSM或其他高級(jí)項(xiàng)目管理認(rèn)證者。
【我們?yōu)槟峁?
?一個(gè)位于學(xué)術(shù)與創(chuàng)新前沿的工作環(huán)境,與世界頂尖的科學(xué)家和研究員共事。
?參與塑造未來(lái)人工智能技術(shù)基礎(chǔ)設(shè)施的寶貴機(jī)會(huì)。
?具有競(jìng)爭(zhēng)力的薪酬福利和廣闊的職業(yè)發(fā)展空間。
?支持您持續(xù)學(xué)習(xí)與發(fā)展的培訓(xùn)資源。