任職資格:
1.本科及以上學(xué)歷(研究生優(yōu)先),計算機、數(shù)據(jù)科學(xué)、人工智能、軟件、通信、自動化相關(guān)專業(yè)優(yōu)先。
2.1年以上數(shù)據(jù)清洗/處理經(jīng)驗/大數(shù)據(jù)/算法工作經(jīng)驗,有LLM或NLP項目經(jīng)驗者優(yōu)先,優(yōu)秀25屆應(yīng)屆生也可投遞
3.具備非結(jié)構(gòu)化數(shù)據(jù)處理經(jīng)驗,處理過大規(guī)模TB級數(shù)據(jù),擅長代碼編寫
4.強烈的責任心與團隊協(xié)作能力,適應(yīng)快節(jié)奏技術(shù)迭代。
5.熟練使用Python及主流數(shù)據(jù)科學(xué)棧(NumPy、Pandas等),具備良好的代碼規(guī)范與工程習(xí)慣;熟悉SQL及常見關(guān)系型/分布式數(shù)據(jù)庫
6.熟悉主流分布式計算或分析框架(如Spark、Hadoop、Rav、Presto等),理解其核心原理與性能調(diào)優(yōu)方法,能在其上開發(fā)或調(diào)優(yōu)數(shù)據(jù)作業(yè)。
7.熟悉主流深度學(xué)習(xí)框架,并對其訓(xùn)練/微調(diào)流程有深刻理解,能清晰分析數(shù)據(jù)質(zhì)量對模型性能的影響。
崗位職責:
1.負責大模型預(yù)訓(xùn)練數(shù)據(jù)的清洗、去噪與結(jié)構(gòu)化處理,構(gòu)建高質(zhì)量語料庫,支持模型訓(xùn)練需求。
2.設(shè)計并實現(xiàn)基于Python的高效數(shù)據(jù)處理Pipeline,優(yōu)化數(shù)據(jù)預(yù)處理流程,提升數(shù)據(jù)質(zhì)量。
3.擅長對接數(shù)據(jù)采集(上游)與模型訓(xùn)練(下游),制定數(shù)據(jù)規(guī)范、質(zhì)量監(jiān)控及閉環(huán)優(yōu)化策略,確保數(shù)據(jù)-模型高效協(xié)同
4.構(gòu)建數(shù)據(jù)自動化評估體系,研究自動化評估算法,能夠高效評估無些督、有些督等各類數(shù)據(jù)質(zhì)量,
5.追蹤業(yè)界開源數(shù)據(jù)進展,清晰了解業(yè)界高質(zhì)量數(shù)據(jù)構(gòu)建體系方法,為星火大模型訓(xùn)練數(shù)據(jù)提供支持。
上班時間:朝九晚六,周末雙休,節(jié)假日正常休
薪資:10-30K面試定薪+餐補300+交補150+年終獎
福利待遇:
1、入職五險一金、帶薪假期、節(jié)日福利、年度體檢;
2、食堂:提供豐富多樣、健康美味的飲食選擇;
3、健身房:免費健身房,在工作之余保持健康的身體狀態(tài);
4、圖書館:免費圖書館,豐富多樣的圖書資源和舒適的閱讀環(huán)境;
5、公租房/租房補貼:符合政策的員工可申請公租房或租房補貼,減輕生活壓力;
6、人才補貼:符合政策的員工可申請政府人才補貼,提高員工的福利待遇;
7、員工團建:不定期組織團建活動,在輕松愉悅的氛圍中放松身心,增強團隊凝聚力;
8、員工成長:提供多方位學(xué)習(xí)通道,包括系統(tǒng)化專業(yè)課程的在線學(xué)習(xí)平臺、大咖分享、技術(shù)沙龍等;