稀疏自编码器

提出思路

自编码器最初提出是基于降维的思想，但是当隐层节点比输入节点多时，自编码器就会失去自动学习样本特徵的能力，此时就需要对隐层节点进行一定的约束，与降噪自编码器的出发点一样，高维而稀疏的表达是好的，因此提出对隐层节点进行一些稀疏性的限值。稀疏自编码器就是在传统自编码器的基础上通过增加一些稀疏性约束得到的。这个稀疏性是针对自编码器的隐层神经元而言的，通过对隐层神经元的大部分输出进行抑制使网路达到一个稀疏的效果。

算法原理

假设我们只有一个没有带类别标籤的训练样本集合

，其中

。自编码神经网路是一种无监督学习算法，它使用了反向传播算法，并让目标值等于输入值，比如

。下图是一个自编码神经网路（图一）的示例。

自编码神经网路尝试学习一个

的函式。换句话说，它尝试逼近一个恆等函式，从而使得输出

接近于输入

。恆等函式虽然看上去不太有学习的意义，但是当我们为自编码神经网路加入某些限制，比如限定隐藏神经元的数量，我们就可以从输入数据中发现一些有趣的结构。举例来说，假设某个自编码神经网路的输入

是一张

图像（共100个像素）的像素灰度值，于是

，其隐藏层

中有50个隐藏神经元。注意，输出也是100维的

。由于只有50个隐藏神经元，我们迫使自编码神经网路去学习输入数据的'''压缩'''表示，也就是说，它必须从50维的隐藏神经元激活度向量

中'''重构'''出100维的像素灰度值输入

。如果网路的输入数据是完全随机的，比如每一个输入

都是一个跟其它特徵完全无关的独立同分布高斯随机变数，那幺这一压缩表示将会非常难学习。但是如果输入数据中隐含着一些特定的结构，比如某些输入特徵是彼此相关的，那幺这一算法就可以发现输入数据中的这些相关性。事实上，这一简单的自编码神经网路通常可以学习出一个跟主元分析（PCA）结果非常相似的输入数据的低维表示。

我们刚才的论述是基于隐藏神经元数量较小的假设。但是即使隐藏神经元的数量较大（可能比输入像素的个数还要多），我们仍然通过给自编码神经网路施加一些其他的限制条件来发现输入数据中的结构。具体来说，如果我们给隐藏神经元加入稀疏性限制，那幺自编码神经网路即使在隐藏神经元数量较多的情况下仍然可以发现输入数据中一些有趣的结构。

稀疏性可以被简单地解释如下。如果当神经元的输出接近于1的时候我们认为它被激活，而输出接近于0的时候认为它被抑制，那幺使得神经元大部分的时间都是被抑制的限制则被称作稀疏性限制。这里我们假设的神经元的激活函式是sigmoid函式。如果你使用tanh作为激活函式的话，当神经元输出为-1的时候，我们认为神经元是被抑制的。

注意到