Проблема: Учитывая некоторые данные, CNN выведет вектор длины 2, представляющий некоторый вид движения.
Однако, используя RMSE или MAE в качестве функции потерь, я заметил, что нейронная сеть будет сходиться к вектору [0,0], потому что в среднем это даст наименьшую ошибку из-за данных обучения, имеющих большое разнообразие величин и направления.
Как я мог избежать этой ошибочной конвергенции?
В качестве возможной переформулировки: я хочу знать, как я мог бы создать функцию потерь, которая наказывает нейронную сеть за принятие простого решения [0,0]
Задача ещё не решена.
Других решений пока нет …