数据结构与算法：算法简介

Rogerspy

2021-04-12

数据结构与算法

字数统计: 1.2k字 | 阅读时长≈ 4分

在开始学习算法之前先说一些废话。

1. 一个算法拯救无数生命

第二次世界大战期间，德军使用 AM 进行信息交流，任何掌握对应 AM 频率和摩斯码的人都可以对信号进行解码得到信息。但是由于信息是被加密的，所以需要对信息进行解密。有时候人们很幸运能够猜对，但是很快德军又换了密码。

阅读全文

数据结构

预训练语言模型-神经网络语言模型：CNNLM

Rogerspy

2021-04-11

语言模型

字数统计: 2.8k字 | 阅读时长≈ 11分

神经网络三大神器：DNN、CNN、RNN。其中 DNN 和 RNN 都已经被用来构建语言模型了，而 CNN 一直在图像领域大展神威，它是否也可以用来构建语言模型呢？如果要用 CNN 构建语言模型应该怎么做？接下来我们从四篇论文看 CNN 构建语言模型的三种方法。

阅读全文

Language Model CNNLM

Text-to-Viz：根据语言描述自动创建信息图表

Rogerspy

2021-04-09

论文解读

字数统计: 3.9k字 | 阅读时长≈ 13分

1. 简介

市面上的专业创建信息图表的工具虽然在努力平衡易用性和功能强大，但是这些工具通常是面向高级用户的，比如设计师、数据科学家等等。对于普通用户非常不友好。

阅读全文

text2viz nl2infographic

随机梯度下降中隐式正则化的起源

Rogerspy

2021-04-06

论文解读

字数统计: 1.8k字 | 阅读时长≈ 6分

首先推荐两篇论文：

Samuel L Smith, Benoit Dherin, David Barrett, Soham De (2021) On the Origin of Implicit Regularization in Stochastic Gradient Descent
David G.T. Barrett, Benoit Dherin (2021) Implicit Gradient Regularization

阅读全文

NLP 隐式正则化

预训练语言模型-神经网络语言模型：LSTMLM

Rogerspy

2021-03-31

语言模型

字数统计: 3.5k字 | 阅读时长≈ 13分

1. 简介

Mikolov 等人提出的 RNN 语言模型解决了前馈神经网络语言模型的语序问题。但是由于 RNN 神经网络本身存在着长程依赖问题，导致 RNN 语言模型很难学到距离较远的信息。

阅读全文

NLP LSTMLM

预训练语言模型-神经网络语言模型：RNNLM

Rogerspy

2021-03-24

语言模型

字数统计: 1.4k字 | 阅读时长≈ 5分

1. 简介

Bengio 等人使用前馈神经网络构建语言模型，解决了两个问题：参数维度爆炸和词与词之间的语义关系的问题。然我们看到使用神经网络构建语言模型存在的巨大潜力。但是前馈神经网络构建的语言模型同样也存在问题：他只能输入特定长度的上下文（窗口 $n$）。也就是说，它只能用固定长度内的信息来预测下一个词，这与 n-gram 模型有相同的问题。

阅读全文

NLP RNNLM