赛博土木A-深度学习05:块组件
复杂的神经网络模型通常由多层结构构成,将其基本构成部分称为块,描单层、多层组件或者整个模型。
从单纯的编程视角出发,块是同过类实现的,考虑到神经网络的性质,这些类需要具备如下的基本功能:
- 输入数据作为前向传播的函数的参数。
- 通过前向传播函数生成输出。
- 计算输出的梯度。
- 存储和访问前向传播计算所需的参数。
- 根据需求初始化模型参数。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 豈風!
评论
复杂的神经网络模型通常由多层结构构成,将其基本构成部分称为块,描单层、多层组件或者整个模型。
从单纯的编程视角出发,块是同过类实现的,考虑到神经网络的性质,这些类需要具备如下的基本功能: