Может кто-нибудь объяснить различия между всеми этими потерями кросс-энтропии? keras говорит о
- Двоичная кросс-энтропия
- Категориальная кросс-энтропия
- разреженная категориальная кросс-энтропия
в то время как тензорный поток имеет
- Софтмакс-кросс-энтропия с логинами
- Разреженная кросс-энтропия Softmax с логинами
- Сигмовидная кросс-энтропия с логинами
(также возникает вопрос: существуют ли типы кросс-энтропии без логитов?)
Каковы различия и отношения между ними? Каковы типичные приложения для них и каков математический фон? Существуют ли другие типы кросс-энтропии, которые нужно знать?