Быстрый метод проверки файлов на HDFS заключается в использовании tail:
~$ hadoop fs -tail /path/to/file
Это отображает последний килобайт данных в файле, что очень полезно. Однако противоположная команда head
не является частью коллекций команд оболочки. Я нахожу это очень удивительным.
Моя гипотеза заключается в том, что, поскольку HDFS построен для очень быстрых потоковых чтений в очень больших файлах, существует некоторая проблема с доступом, которая влияет на head
. Это заставляет меня нерешительно делать что-то, чтобы получить доступ к голове. Кто-нибудь имеет ответ?