中国僵尸片,亚洲欧美国产另类视频,亚洲精品无码人妻无码,亚洲有码转帖,亚洲欧美精品伊人久久,97精品依人久久久

更新于 4月22日

數(shù)據(jù)工程師(深度學(xué)習(xí)/大模型方向)

1.5-2.5萬
  • 上海浦東新區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招2人

雇員點(diǎn)評標(biāo)簽

  • 工作環(huán)境好
  • 同事很nice
  • 團(tuán)隊(duì)執(zhí)行強(qiáng)
  • 人際關(guān)系好
  • 氛圍活躍
  • 交通便利
  • 實(shí)力大公司
  • 五險(xiǎn)一金

職位描述

人工智能云計(jì)算/大數(shù)據(jù)
崗位職責(zé) 1. 數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建 1.1 設(shè)計(jì)并搭建面向深度學(xué)習(xí)和大模型訓(xùn)練的高效數(shù)據(jù)管道(Data Pipeline),支持TB/PB級多模態(tài)數(shù)據(jù)(文本、圖像、語音等)的采集、清洗、存儲與分布式處理。 1.2 優(yōu)化數(shù)據(jù)預(yù)處理流程(ETL/ELT),提升數(shù)據(jù)吞吐量與處理效率,滿足大模型訓(xùn)練對海量數(shù)據(jù)的實(shí)時(shí)性需求。 2. 數(shù)據(jù)質(zhì)量管理 2.1 開發(fā)數(shù)據(jù)質(zhì)量監(jiān)控工具,識別并修復(fù)數(shù)據(jù)噪聲、缺失、偏差等問題,確保訓(xùn)練數(shù)據(jù)的可靠性。 2.2 建立數(shù)據(jù)版本控制機(jī)制,跟蹤數(shù)據(jù)變更歷史,支持模型訓(xùn)練的可復(fù)現(xiàn)性。 3. 分布式數(shù)據(jù)處理 3.1 基于Spark、Flink、Ray等框架構(gòu)建分布式數(shù)據(jù)處理系統(tǒng),加速數(shù)據(jù)并行與模型訓(xùn)練效率。 3.2 與算法團(tuán)隊(duì)協(xié)作,優(yōu)化數(shù)據(jù)分片、采樣策略,適配分布式訓(xùn)練框架。 4. 數(shù)據(jù)合規(guī)與安全 4.1 設(shè)計(jì)數(shù)據(jù)脫敏、匿名化方案,確保敏感數(shù)據(jù)(如用戶隱私數(shù)據(jù))符合GDPR等法規(guī)要求。 4.2 構(gòu)建數(shù)據(jù)權(quán)限管理體系,實(shí)現(xiàn)細(xì)粒度訪問控制。 任職要求 1. 精通Python,熟悉SQL及至少一種大數(shù)據(jù)框架(Spark/Flink)。 2. 熟練使用Airflow、Kafka、Dagster等工具構(gòu)建數(shù)據(jù)工作流。 3. 熟悉數(shù)據(jù)湖(Delta Lake/Iceberg)、向量數(shù)據(jù)庫(Milvus/Pinecone)等新型存儲技術(shù)。 4. 理解深度學(xué)習(xí)數(shù)據(jù)需求:掌握TFDS、HuggingFace Datasets等工具,熟悉數(shù)據(jù)并行/流水線并行邏輯。 經(jīng)驗(yàn)背景 1. 3年以上數(shù)據(jù)工程經(jīng)驗(yàn),至少1年支持過大規(guī)模模型(LLM/CV大模型)數(shù)據(jù)體系建設(shè)。 2. 有完整的數(shù)據(jù)治理項(xiàng)目經(jīng)驗(yàn),熟悉數(shù)據(jù)血緣追蹤、元數(shù)據(jù)管理(如Apache Atlas)。

工作地點(diǎn)

上海浦東新區(qū)科技領(lǐng)袖之都43號樓

職位發(fā)布者

周蓓麗/人事經(jīng)理

昨日活躍
立即溝通
公司Logo浪潮集團(tuán)公司標(biāo)簽
浪潮集團(tuán)是中國領(lǐng)先的云計(jì)算、大數(shù)據(jù)服務(wù)商,擁有三家上市公司。主要業(yè)務(wù)涉及計(jì)算裝備、軟件、云計(jì)算服務(wù)、新一代通信、大數(shù)據(jù)及若干應(yīng)用場景。作為中國最早的IT品牌之一,浪潮致力于成為世界一流的新一代信息技術(shù)龍頭企業(yè)經(jīng)濟(jì)社會數(shù)字化轉(zhuǎn)型的優(yōu)秀服務(wù)商,新型基礎(chǔ)設(shè)施建設(shè)的骨干企業(yè)。
公司主頁