職位描述
職位描述
1. 負(fù)責(zé)多模態(tài)文檔解析模型的訓(xùn)練、調(diào)優(yōu)、評(píng)測(cè)和部署;
2. 研究業(yè)務(wù)場(chǎng)景中版面分析、表格解析、全文解析的實(shí)現(xiàn)及優(yōu)化,助力多模態(tài)大模型(LMM)在金融文檔解析和信息抽取上落地;
3. 跟蹤最新的 LMM 及人工智能領(lǐng)域進(jìn)展,持續(xù)進(jìn)行新技術(shù)迭代;
4. 進(jìn)行文檔場(chǎng)景、多模態(tài)場(chǎng)景相關(guān)的數(shù)據(jù)采集、清洗和制備。
職位要求
1. 本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)優(yōu)先;
2. 具備扎實(shí)的 Python 編程能力,熟悉至少一種深度學(xué)習(xí)框架,能夠在較短時(shí)間內(nèi)理解源碼,代碼書寫規(guī)范,具有良好的編程能力和扎實(shí)的數(shù)學(xué)理論基礎(chǔ);
3. 具備OCR、文檔解析和多模態(tài)相關(guān)經(jīng)驗(yàn),熟悉 Qwen2.5-VL、GOT-OCR2.0等模型,有多模態(tài)大模型(LMM)相關(guān)經(jīng)驗(yàn)者優(yōu)先;
4. 熟練掌握 Linux 常用命令,熟悉Vim、Git 工具;
5. 有良好的文檔書寫習(xí)慣,能夠編寫規(guī)范化的技術(shù)文檔;
6. 表達(dá)清晰,溝通順暢,具備良好的團(tuán)隊(duì)協(xié)作和溝通能力;
7. 熟悉多模態(tài)方向的最新技術(shù)進(jìn)展,關(guān)注行業(yè)前沿,對(duì)技術(shù)開發(fā)及應(yīng)用有熱情,有自己的想法并樂于挑戰(zhàn)自我