Cross-Language Transfer Learning and Domain Adaptation for End-to-End Automatic Speech Recognition.

Jian Luo,Jianzong Wang,Ning Cheng,Edward Xiao,Jing Xiao,Georg Kucsko,Patrick K. O'Neill,Jagadeesh Balam,Slyne Deng,Adriana Flores,Boris Ginsburg,Jocelyn Huang,Oleksii Kuchaiev,Vitaly Lavrukhin,Jason Li

ICME（2021）

引用 14|浏览22

暂无评分

摘要

In this paper, we demonstrate the efficacy of transfer learning and continuous learning for various automatic speech recognition (ASR) tasks using end-to-end models trained with CTC loss. We start with a large pre-trained English ASR model and show that transfer learning can be effectively and easily performed on: (1) different English accents, (2) different languages (from English to German, Spanish, Russian, or from Mandarin to Cantonese) and (3) application-specific domains. Our extensive set of experiments demonstrate that in all three cases, transfer learning from a good base model has higher accuracy than a model trained from scratch. Our results indicate that, for fine-tuning, larger pre-trained models are better than small pre-trained models, even if the dataset for fine-tuning is small. We also show that transfer learning significantly speeds up convergence, which could result in significant cost savings when training with large datasets.

查看译文

关键词

cross-language,transfer learning,continue learning,speech recognition,domain adaptation

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要