乐读窝

深度学习

乐读窝 > 文学理论 > 深度学习

10.6 递归神经网络

书籍名:《深度学习》    作者:伊恩.古德费洛



递归神经网络(2)代表循环网络的另一个扩展,它被构造为深的树状结构而不是RNN的链状结构,因此是不同类型的计算图。递归网络的典型计算图如图10.14所示。递归神经网络由Pollack(1990)引入,而Bottou(2011)描述了这类网络的潜在用途——学习推论。递归网络已成功地应用于输入是数据结构的神经网络(Frasconi  et  al.,1997,1998),如自然语言处理(Socher  et  al.,2011a,c,2013a)和计算机视觉(Socher  et  al.,2011b)。

递归网络的一个明显优势是,对于具有相同长度τ的序列,深度(通过非线性操作的组合数量来衡量)可以急剧地从τ减小为O(logτ),这可能有助于解决长期依赖。一个悬而未决的问题是如何以最佳的方式构造树。一种选择是使用不依赖于数据的树结构,如平衡二叉树。在某些应用领域,外部方法可以为选择适当的树结构提供借鉴。例如,处理自然语言的句子时,用于递归网络的树结构可以被固定为句子语法分析树的结构(可以由自然语言语法分析程序提供)(Socher  et  al.,2011a,c)。理想的情况下,人们希望学习器自行发现和推断适合于任意给定输入的树结构,如(Bottou,2011)所建议。

图10.14 递归网络将循环网络的链状计算图推广到树状计算图。可变大小的序列x(1),x(2),…,x(t)可以通过固定的参数集合(权重矩阵U,V,W)映射到固定大小的表示(输出o)。该图展示了监督学习的情况,其中提供了一些与整个序列相关的目标y

递归网络想法的变种存在很多。例如,Frasconi  et  al.(1997)和Frasconi  et  al.(1998)将数据与树结构相关联,并将输入和目标与树的单独节点相关联。由每个节点执行的计算无须是传统的人工神经计算(所有输入的仿射变换后跟一个单调非线性)。例如,Socher  et  al.(2013a)提出用张量运算和双线性形式,在这之前人们已经发现当概念是由连续向量(嵌入)表示时,这种方式有利于建模概念之间的联系(Weston  et  al.,2010;Bordes  et  al.,2012)。