Неправильная сходимость нейронной сети Conv для определения вектора (функция потерь)

Question

Неправильная сходимость нейронной сети Conv для определения вектора (функция потерь)

Проблема: Учитывая некоторые данные, CNN выведет вектор длины 2, представляющий некоторый вид движения.

Однако, используя RMSE или MAE в качестве функции потерь, я заметил, что нейронная сеть будет сходиться к вектору [0,0], потому что в среднем это даст наименьшую ошибку из-за данных обучения, имеющих большое разнообразие величин и направления.

Как я мог избежать этой ошибочной конвергенции?

В качестве возможной переформулировки: я хочу знать, как я мог бы создать функцию потерь, которая наказывает нейронную сеть за принятие простого решения [0,0]

0

artificial-intelligence c++conv-neural-network machine-learning neural-network

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

Источник