基于多种知识的盲文翻译的研究

Journal of Tsinghua University(2000)

引用 0|浏览7
暂无评分
摘要
盲文到汉字的转换研究,分为盲文到拼音和拼音到汉字的转换研究.论文通过引入音码表,很好地解决了盲文到拼音转换中的歧义问题.对于拼音到汉字的转换,采用Markov模型,使用平滑算法解决此模型中的数据稀疏问题,并且对通常使用的字级别二元模型的平滑算法进行了改进以适应词级别二元模型.为每一个拼音句子建立一个拼音到汉字转换多部图,并在此转换多部图中使用Viterbi算法搜索一条具有最大似然度的汉语句子,或使用N-Best算法搜索具有头N大似然度的N个汉语句子.同时研究了从1选到N选的转换判据,以进行自动的N-Best转换.实验表明,盲文到汉字转换系统的转换正确率为94.38%,若剔除专有名词,转换正确率还可上升2个百分点.对N-Best搜索算法的测试表明5选正确率比1选正确率提高了3个百分点.
更多
查看译文
关键词
Braille translation,Multi-knowledge,Smoothing method,Virterbi algorithm
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要