如何构建下一代机器翻译系统——Building Machine Translation Systems for the Next Thousand Languages

标签:机器翻译,自然语言处理 时间:2022-05-15 22:30:55.963 发布者:小木

论文名:Building Machine Translation Systems for the Next Thousand Languages
发布时间:2022-05
论文地址:https://arxiv.org/abs/2205.03983
代码地址:

原文摘要:本周,谷歌的研究人员在arXiv上提交了一个非常有意思的论文,其主要目的就是分享了他们建立能够翻译一千多种语言的机器翻译系统的经验和努力。这篇论文最大的亮点是总结了谷歌在建立机器翻译系统上的一些工程实践:包括从网络爬取数据集,对于噪音的处理以及建立语料库的一些经验和技巧。