1.負(fù)責(zé)語音識(shí)別系統(tǒng)的算法研究、開發(fā)與優(yōu)化,包括聲學(xué)模型、語
言模型的構(gòu)建與調(diào)優(yōu),提升識(shí)別準(zhǔn)確率與效率。
2.針對(duì)智能座艙各行車場(chǎng)景優(yōu)化喚醒、語音識(shí)別效果,解決噪聲干
擾、多語種/方言適配、低資源設(shè)備端語音識(shí)別等技術(shù)難點(diǎn)。
3.設(shè)計(jì)語音數(shù)據(jù)挖掘與清洗策略,參與大規(guī)模語音數(shù)據(jù)集構(gòu)建,提
升模型訓(xùn)練效果。
4.探索前沿技術(shù)(如端到端模型、大語言模型融合等),推動(dòng)ASR
技術(shù)在生成式A1、多模態(tài)交互等領(lǐng)域的應(yīng)用。
1.學(xué)歷要求:碩士及以上學(xué)歷。
2.專業(yè)要求:計(jì)算機(jī)科學(xué)、信號(hào)處理、電子信息、自動(dòng)化等相關(guān)專
業(yè)。
3.工作經(jīng)歷:3年以上語音識(shí)別相關(guān)項(xiàng)目經(jīng)驗(yàn),具備工業(yè)級(jí)ASR系統(tǒng)
開發(fā)能力者優(yōu)先。
4.專業(yè)技能:.1 扎實(shí)的數(shù)學(xué)與算法基礎(chǔ),熟悉語音信號(hào)處理、機(jī)器學(xué)習(xí)、深度
學(xué)習(xí)原理,掌握聲學(xué)建模(如HMM、CTC)及語言模型(如
N-gram、Transformer)
4.2精通Python/C++編程,熟練使用Shell腳本,熟悉Linux開發(fā)環(huán)
境及CUDA加速技術(shù);
4.3熟悉ASR開源工具鏈(如Kaldi、Wenet)及大模型優(yōu)化技術(shù)
(如Whisper微調(diào)、LORA適配)
4.4熟悉多語種語音處理、端到端語音模型或嵌入式端側(cè)部署經(jīng)驗(yàn)
者優(yōu)先。