Подтвердить что ты не робот

Что именно вызывает двоичный файл "тарабарщина"?

Я не нашел ответа на этот конкретный вопрос; возможно, нет ни одного. Но я немного об этом думал.

Что именно заставляет двоичный файл отображаться как "тарабарщина", когда вы смотрите на него в текстовом редакторе? Это то же самое с зашифрованными файлами. Являются ли двоичные значения файла, которые нужно преобразовать в ASCII? Можно ли преобразовать представление для отображения необработанных двоичных значений, т.е. Показать 1 и 0, которые составляют файл?

Наконец, есть ли способ определить, какая программа будет правильно открывать файл данных? Во многих случаях, особенно в Windows, файл становится сиротой или иным образом не связан с конкретной программой. Открытие его в текстовом редакторе иногда говорит вам, где оно принадлежит, но большую часть времени его нет, из-за тарабарщины. Если расширение не предоставляет никакой информации, как вы можете определить, к какой программе она принадлежит?

4b9b3361

Ответ 1

  • Являются ли бинарные значения файла, которые нужно преобразовать в ASCII?

Да, это именно то, что происходит. Как правило, двоичные значения файла также включают управляющие символы ASCII, которые не подлежат печати, что приводит к еще более причудливому отображению в типичном текстовом редакторе.

  • Можно ли преобразовать представление для отображения необработанных двоичных значений, т.е. для отображения 1s и 0s, которые составляют файл?

Это зависит от вашего редактора. То, что вы хотите, это "шестнадцатеричный редактор", а не обычный текстовый редактор. Это покажет вам исходное содержимое файла (как правило, в шестнадцатеричном, а не в двоичном виде, поскольку нули и единицы занимают много места и их труднее читать).

  • Наконец, есть ли способ определить, какая программа будет правильно открыта файл данных?

Существует программа командной строки Linux под названием "file" , которая попытается проанализировать файл (обычно ищет общие шаблоны заголовков) и скажите, что это за файл (например, текст, аудио или видео, или XML и т.д.). Я не уверен, есть ли эквивалентная программа для Windows. Конечно, выход этой программы является лишь предположением, но это может быть очень полезно, когда вы не знаете, какой формат файла.

Ответ 2

Двоичный файл появляется как тарабарщина, потому что данные в нем предназначены для чтения машины, а не для людей. К сожалению, некоторые из нас привыкают к толкованию тарабарщины - хотя и с некоторыми специализированными инструментами, которые помогают лучше видеть данные, но большинство людей не должны знать.

Каждый байт в файле рассматривается как символ в текущем наборе кода (возможно, CP1252 в Windows). Байт-значение 65 является, например, "А"; вы можете легко найти иллюстративные примеры в Интернете. Таким образом, байты, составляющие двоичные данные, отображаются в соответствии с набором кода - как и текстовый редактор. Он не пытается преобразовать двоичный файл - он не знает, как (только оригинальная программа).

Что касается того, как определить, какая программа создала файл, вы можете сделать это иногда, но не легко и надежно. В Unix (или с Cygwin в Windows) программа "файл" может помочь. Эта программа просматривает первые несколько байтов, чтобы попытаться угадать программу.

Зашифрованные данные должны выглядеть как тарабарщина. Если это не похоже на тарабарщину, то это, вероятно, не очень хорошо зашифровано.

Ответ 3

Дисплей выглядит интересным, потому что двоичный файл может содержать непечатаемые символы. Программа отображения должна заменить что-то другое.

Это можно предотвратить, используя шестнадцатеричный редактор. Такая программа отображает каждый байт из файла как его шестнадцатеричное значение. Это обеспечивает хороший табличный вид файла, но среднему человеку нелегко расшифровать это представление, потому что мы не привыкли смотреть на данные таким образом.

Существует несколько способов узнать, к какой программе может принадлежать файл. Вы можете посмотреть начало файла и с некоторыми знаниями узнать тип файла. Существуют некоторые типы, начинающиеся с одних и тех же символов (RAR, GIF и т.д.). Для других типов это может быть не так просто.

В Linux вы можете использовать команду "файл", чтобы помочь вам определить тип файла. Вероятно, программы для Windows будут делать то же самое.

Ответ 4

Файлы причин, которые двоично отображаются как тарабарщина при просмотре в стандартных текстовых редакторах, таких как блокнот, - это то, что при отображении с кодировками, обычно используемыми этими типами приложений (например, ASCII UTF-8), данные сопоставляются с символами, когда он кодируется для отображения, выход этого процесса обычно делает малозначимым для человека, как отображаемые двоичные данные, ergo тарабарщина, которую вы видите

Как упоминалось ранее, эти файлы имеют больший смысл, если смотреть по-другому, например, с шестнадцатеричным редактором.

Определенные типы файлов могут быть распознаны данными, присутствующими во всех файлах определенного типа, например, все исполняемые файлы (*.exe) начинаются с букв MZ

Ответ 5

Двоичные данные часто очень случайны. Зашифрованные данные, в частности, по определению. Каждый байт может быть представлен одним из 256 символов (выходящий из Unicode из уравнения). ASCII охватывает только 128 из них, и только 94 из них являются фактическими печатными символами. Вне диапазона ASCII у вас есть несколько международных символов и странных символов. Есть, конечно, более 128 из них, поэтому необходимо указать кодовую страницу для выбора определенного набора символов.

В любом случае, поскольку двоичные файлы могут быть представлены как очень случайный ассортимент знакомых и незнакомых символов, файл будет выглядеть как тарабарщина, если вы откроете его в редакторе.

Вы всегда можете открыть файл (двоичный или текстовый файл, в действительности нет никакой разницы) в шестнадцатеричном редакторе и посмотреть на необработанные двоичные данные.

Невозможно определить, какая программа создала определенный файл. В частности, если программа зашифровала свои данные, вся надежда утеряна. В противном случае часто бывает легко распознать определенные "подписи".

Ответ 6

Да, Wordpad и Блокнот и многие другие текстовые редакторы предполагают, что любой файл, который вы открываете с ним, является текстовым файлом и будет пытаться отображать символы ASCII, представленные байтами в файле.

Hex Editors создаются для просмотра и редактирования двоичных файлов. Обычно они отображают каждый байт в виде пары шестнадцатеричных цифр вместо "1s и 0s", потому что легче читать этот путь.

Ответ 7

Текстовый редактор делает очень мало предположений относительно данных, поступающих в него, помимо таких вещей, как кодировки символов. Таким образом, он (как вы говорите) читает данные файла как ASCII и отображает его таким образом. Поскольку двоичные данные не всегда попадают в буквенно-цифровой диапазон, вы получаете тарабарщину. Что касается отображения необработанных двоичных значений, вам нужен шестнадцатеричный редактор, например XVI32.

Двоичные файлы часто не имеют контекста вне программы, которая их использует. Некоторые бинарные форматы содержат 4-байтовую магическую последовательность в начале (например, файлы Java.class начинаются с "CAFE" ), но для распознавания их без их программы вам необходимо сопоставить эти 4-байтовые последовательности. Я считаю, что некоторые дистрибутивы Linux содержат эту информацию для самых разных двоичных форматов и будут исследовать начало файла, чтобы попытаться его идентифицировать. Помимо этого, вы не можете многое сделать.