Я не уверен, как точно сформулировать этот вопрос, так вот пример:
string1 = "THEQUICKBROWNFOX" string2 = "KLJHQKJBKJBHJBJLSDFD"
Мне нужна функция, которая будет забивать string1 выше строки2 и миллион других строк тарабарщины. Обратите внимание на отсутствие пробелов, поэтому это пошаговая функция, а не слово за словом.
В 90-х годах я написал функцию триграммного подсчета в Delphi и заполнил ее триграммами от Huck Finn, и я подумываю о переносе кода на C или Python или удалении его в автономный инструмент, но должен быть более эффективными способами. Я буду делать это миллионы раз, поэтому скорость хорошая. Я попробовал библиотеку pveron Reverend.Thomas Beyse() и обучил ее некоторым целым строкам-шапкам, но, похоже, они требуют пробелов между словами и, таким образом, возвращают оценку []. Я нашел некоторые библиотеки Markov Chain, но они также, казалось, требовали пробелов между словами. Хотя из моего понимания их я не понимаю, почему так должно быть...
Во всяком случае, я делаю много криптоанализа, поэтому в будущих скоринговых функциях, которые используют пробелы и пунктуацию, было бы полезно, но сейчас мне нужно всего лишь ALLCAPITALLETTERS.
Спасибо за помощь!