预训练语言模型:Data noising smoothing Rogerspy 2021-09-15 语言模型 字数统计: 155字 | 阅读时长≈ 1分 数据噪化(data noising)是一种非常有效的神经网络正则化的有段,通常被用在语音和视觉领域,但是在离散序列化数据(比如语言模型)上很少应用。本文尝试探讨给神经网络语言模型加噪声与 n-gram 语言模型中的平滑之间的联系,然后利用这种联系设计出一种噪声机制,帮助我们对语言进行建模。 阅读全文 Language Model data noising