工作單位:用電公司
崗位職責:
1、負責收集公司各產(chǎn)品線相關的數(shù)據(jù),并進行清洗、轉(zhuǎn)換和加載操作,確保數(shù)據(jù)的質(zhì)量和可用性。
2、負責構建高質(zhì)量、領域適配的指令數(shù)據(jù)對,并通過清洗、增強、評估確保數(shù)據(jù)在語義一致性、多樣性和安全性上滿足微調(diào)需求。
3、負責將多源異構數(shù)據(jù)轉(zhuǎn)化為結構化知識,并通過高效存儲與檢索系統(tǒng)支撐大模型的知識增強與應用。
崗位要求:
1、本科及以上學歷(計算機、電氣工程、數(shù)學、人工智能等相關專業(yè)),具有良好的溝通協(xié)調(diào)能力、邏輯思維能力和學習能力;
2、3年以上數(shù)據(jù)開發(fā)經(jīng)驗或者1年以上大模型數(shù)據(jù)工程相關經(jīng)驗,有電力領域數(shù)據(jù)治理? 經(jīng)驗者優(yōu)先;精通Java、Python(Pandas/Numpy)、SQL;
3、熟悉以下至少一項技術,1)精通數(shù)據(jù)清洗、ETL流程?,處理過TB級數(shù)據(jù)?,2)熟悉數(shù)據(jù)質(zhì)量評估?(重復率、信息密度、毒性檢測),熟悉數(shù)據(jù)增強技術;3)有結構化知識轉(zhuǎn)化經(jīng)驗,熟悉向量數(shù)據(jù)庫 或圖數(shù)據(jù)庫。
4、開發(fā)過自動化數(shù)據(jù)清洗工具或數(shù)據(jù)質(zhì)量監(jiān)控系統(tǒng)?,熟悉多模態(tài)數(shù)據(jù)處理優(yōu)先