Это повторяющаяся концепция, и вам следует убедиться, что вы ее понимаете.

Хотя рекуррентные нейронные сети (RNN) относительно старые (с 1980-х годов), они все еще являются базовой моделью, лежащей в основе многих приложений для работы с речью, текстом, аудио и финансовыми данными. Эта статья представляет собой введение в основную идею RNN.

  1. Почему? Такие данные, как изображения, часто можно просто обрабатывать по одному с помощью сети с прямой связью. Однако иногда данные не являются независимыми от других данных, и вам действительно нужно: 1. ввести несколько фрагментов данных вместе, потому что они зависят друг от друга (например, слова в предложении), или 2. текущие на данные влияют прошлые входные данные (например, финансовые данные с течением времени).
  2. Что? рекуррентная нейронная сеть (RNN) - это модель, которая зацикливает информацию о множественных входных данных обратно в сеть для захвата последовательных или временные данные.
  3. Как? В RNN входные данные разделяются на несколько элементов (также называемых временными шагами) и вводятся в модель по одному, при этом выход каждого элемента является «скрытое состояние», которое возвращается в модель вместе со следующим элементом ввода. Фактические веса сети RNN остаются неизменными для всех элементов обучающего примера, пока не будут вычислены окончательные выходные данные и эта ошибка не будет использоваться для обновления весов.

Статьи по теме:





« Последовательность для последовательного обучения с помощью нейронных сетей (2014) | минутное резюме
Сможете ли вы [закодировать-] расшифровать этот документ? medium.com »