崗位職責(zé):
1、數(shù)據(jù)清洗與治理:
①負(fù)責(zé)公司核心業(yè)務(wù)系統(tǒng)內(nèi)部數(shù)據(jù)的全面清洗、校驗和標(biāo)準(zhǔn)化工作,識別并處理數(shù)據(jù)中的缺失、錯誤與不一致問題。
②建立和維護(hù)長效的數(shù)據(jù)清洗規(guī)則、流程與質(zhì)量標(biāo)準(zhǔn),提升核心數(shù)據(jù)資產(chǎn)的準(zhǔn)確性與可用性。
2、模型開發(fā)與自動化:
①設(shè)計并開發(fā)數(shù)據(jù)清洗、分類與打標(biāo)模型,利用規(guī)則引擎與機器學(xué)習(xí)算法,實現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù)的智能歸類與信息提取。
②應(yīng)用自然語言處理(NLP)等技術(shù),對非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行智能解析,挖掘深層信息。
③構(gòu)建數(shù)據(jù)質(zhì)量監(jiān)控與異常檢測模型,實現(xiàn)數(shù)據(jù)問題的主動發(fā)現(xiàn)與預(yù)警。
3、數(shù)據(jù)價值挖掘與分析:
①基于治理后的高質(zhì)量數(shù)據(jù),進(jìn)行深度分析與挖掘,揭示業(yè)務(wù)規(guī)律、風(fēng)險點和優(yōu)化機會。
②通過建立數(shù)據(jù)分析模型,為業(yè)務(wù)決策、產(chǎn)品優(yōu)化、風(fēng)險管控等提供量化依據(jù)與數(shù)據(jù)支持。
4、數(shù)據(jù)產(chǎn)品與報告:
①開發(fā)可視化的數(shù)據(jù)看板與自動化報告,持續(xù)監(jiān)控數(shù)據(jù)健康度并賦能業(yè)務(wù)團(tuán)隊。
②將核心數(shù)據(jù)模型與分析方法沉淀為可復(fù)用的數(shù)據(jù)工具或服務(wù)。
任職要求:
1、編程與工具:
熟練掌握 Python 進(jìn)行數(shù)據(jù)清洗、分析和建模,精通 Pandas, NumPy, Scikit-learn 等核心庫。
熟練使用 SQL,能夠進(jìn)行復(fù)雜的數(shù)據(jù)處理與提取。
具備使用數(shù)據(jù)可視化工具(如 Tableau, Power BI)的能力。
2、數(shù)據(jù)建模能力:
具備扎實的數(shù)據(jù)挖掘和機器學(xué)習(xí)知識,有實際的數(shù)據(jù)分類、聚類、自然語言處理(NLP)等項目經(jīng)驗。
熟悉模型構(gòu)建的全流程,包括特征工程、模型訓(xùn)練、評估與優(yōu)化。
3、數(shù)據(jù)敏感度:
對數(shù)據(jù)有高度的敏感性和嚴(yán)謹(jǐn)性,具備優(yōu)秀的數(shù)據(jù)清洗和質(zhì)量控制能力。
4、加分項:
有處理復(fù)雜B端業(yè)務(wù)系統(tǒng)數(shù)據(jù)(如供應(yīng)鏈、ERP、CRM等)經(jīng)驗者優(yōu)先。
具備大數(shù)據(jù)處理經(jīng)驗(如 Spark)者優(yōu)先。
5、綜合素質(zhì):
具備優(yōu)秀的邏輯分析能力和系統(tǒng)性解決問題的能力。
具有良好的溝通能力和團(tuán)隊協(xié)作精神,能夠?qū)?fù)雜的技術(shù)問題轉(zhuǎn)化為清晰的業(yè)務(wù)語言。
對工作認(rèn)真負(fù)責(zé),有強烈的自驅(qū)力,樂于探索數(shù)據(jù)背后的業(yè)務(wù)價值。