外包崗位,學(xué)信網(wǎng)可查本科學(xué)歷及以上學(xué)歷,入職會背調(diào)
工作時間:9:30-18:30,雙休,入職繳納五險一金
職位描述
1、構(gòu)建并維護結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)庫;
2、執(zhí)行數(shù)據(jù)清洗、特征提取及質(zhì)量控制;
3、整理化合物、生物活性、ADMET等多源數(shù)據(jù);
4、與AI算法組合作交付高質(zhì)量數(shù)據(jù)與代碼版本管理維護;
5、制定數(shù)據(jù)標(biāo)準(zhǔn)及安全規(guī)范。
職位要求
1、計算機、信息科學(xué)或生物信息學(xué)相關(guān)專業(yè)本科及以上學(xué)歷;
2、熟練掌握Python SQL Pandas, 熟悉MapReduce 或 Spark 程序 熟練進行常見的大數(shù)據(jù)任務(wù)開發(fā)
3、五年以上大數(shù)據(jù)開發(fā)經(jīng)驗 能夠獨立完成中小型大數(shù)據(jù)項目的開發(fā) 包括數(shù)據(jù)處理流程設(shè)計 代碼實現(xiàn)和測試, 熟悉數(shù)據(jù)預(yù)處理流程,為AI算法team交付高質(zhì)量的數(shù)據(jù)以及進行代碼維護
4、掌握常見的數(shù)據(jù)處理工具(如 Kafka) 能夠進行數(shù)據(jù)的導(dǎo)入和導(dǎo)出
5、有科研數(shù)據(jù)標(biāo)注經(jīng)驗者優(yōu)先,了解化學(xué)/藥物相關(guān)數(shù)據(jù)庫(ChEMBL、PubChem等)者優(yōu)先;
6、具有與ai算法項目合作進行相關(guān)數(shù)據(jù)pipeline開發(fā)管理交付經(jīng)驗優(yōu)先
7、邏輯思維清晰,較強學(xué)習(xí)能力,具備團隊協(xié)作精神。