Джефф Этвуд недавно написал твиттерную ссылку на сообщение CodeReview, где он хотел узнать, может ли сообщество улучшить его "расчет энтропии строки" фрагмента кода. Он объяснил: "Мы вычисляем энтропию строки в нескольких местах в Qaru в качестве знака низкого качества".
Суть его метода заключалась в том, что если вы подсчитаете количество уникальных символов в строке, это означает энтропию (код, взятый из PieterG answer):
int uniqueCharacterCount = string.Distinct().Count();
Я не понимаю, как уникальное количество символов означает энтропию строки и как энтропия строки означает низкое качество. Мне было интересно, может ли кто-то с большим количеством знаний в этой области объяснить, что пытается предпринять мистер Этвуд.
Спасибо!