【崗位描述】
1.結合大模型能力與業(yè)務數(shù)據(jù),深度挖掘處理互聯(lián)網(wǎng)海量結構化及非結構化數(shù)據(jù),應用先進的統(tǒng)計建模、數(shù)據(jù)挖掘、機器學習等方法構建數(shù)據(jù)模型,優(yōu)化算法,提升數(shù)據(jù)分析效率;
2.負責業(yè)務數(shù)據(jù)分析、采集與預處理,數(shù)據(jù)可視化對接,開發(fā)數(shù)據(jù)接口,對接數(shù)據(jù)可視化工具或其他展示系統(tǒng);
3.負責數(shù)據(jù)分析任務的開發(fā)工作,包括定時批處理分析及流式實時計算。
【任職資格】
1.碩士及以上學歷,計算機、軟件工程、通信、自動化、信息管理等相關專業(yè);
2.具有較強的需求分析及代碼開發(fā)能力,有數(shù)據(jù)分析或大數(shù)據(jù)領域工作經驗者優(yōu)先;
3.熟練使用至少一種主流數(shù)據(jù)庫(如Oracle、MySQL、PostgreSQL);
4.熟悉大數(shù)據(jù)生態(tài)及業(yè)界數(shù)據(jù)分析相關產品,深度了解Hadoop、Hive、Spark、Storm、Flink等組件,具備Hadoop/Spark代碼級的調優(yōu)經驗;
5.了解ETL及前端可視化,有流式數(shù)據(jù)處理經驗優(yōu)先;
6.熟練掌握Python或Java開發(fā)語言,熟練使用Linux操作系統(tǒng)。