Хранит ли HDFS неразборные файлы в одном узле данных?

1

Для нерасщепляемых файлов, таких как GZIP будет только одно задание карты, потому что файлы GZIP не могут быть разделены. Есть ли какой-либо вариант или оптимизация для хранения всех блоков таких файлов в одном узле данных, чтобы мы могли хотя бы экономить пропускную способность сети?

Теги:
hadoop
hdfs
compression

1 ответ

2
Лучший ответ

Увеличение размера блока HDFS для вашего файла gzip, превышающего размер файла, должно сделать трюк. Для получения дополнительной информации о настройке размера блока HDFS для файла см. Этот ответ

Ещё вопросы

Сообщество Overcoder
Наверх
Меню