【崗位職責】
(實習3~4天/周 實習6個月以上)
1、跟蹤并研究強化學習(Reinforcement Learning, RL)領域的最新研究進展,具備較強的論文閱讀與復現(xiàn)能力;?
2、基于目前的E2E算法,開發(fā)與之適配的RL策略,探索其在自動駕駛場景中的應用;?
3、協(xié)助構(gòu)建高質(zhì)量的仿真環(huán)境與真實數(shù)據(jù)集,推動算法在實際任務中的泛化能力;?
4、優(yōu)化現(xiàn)有RL算法的訓練效率與穩(wěn)定性,提升策略收斂速度與性能表現(xiàn);
【任職要求】
1.掌握python,熟悉pytorch框架,具備扎實的深度學習和大語言模型算法基礎;?
2.具備扎實的機器學習、深度學習與強化學習理論基礎,熟悉常見RL算法(如DQN、PPO、SAC、TD3等);?
3.熟悉OpenAI Gym、 Carla 、Unity ML-Agents等仿真平臺;?
4.計算機、信息、數(shù)學、電子、自動化、機械、測控、汽車等相關專業(yè)碩士及以上學歷,具有扎實的數(shù)學功底和算法基礎;計算機基礎扎實,熟練掌握Python、Pytorch編程,熟悉Linux?
5.熟悉Sparsedrive、VAD、driveVLM等端到端自動駕駛算法優(yōu)先
【加分項】?
有強化學習在真實系統(tǒng)(如機器人、自動駕駛等)中的應用經(jīng)驗;?
熟悉多智能體強化學習(MARL)、元強化學習(Meta-RL)或?qū)哟螐娀瘜W習(HRL);?
掌握C++、CUDA等底層編程語言,具備高性能計算優(yōu)化經(jīng)驗;?
熟悉Ray RLlib、Stable-Baselines3、CleanRL等開源強化學習框架;??