У меня есть большое количество статических данных, которые должны предлагать произвольный доступ. Так как я использую Disco для его переваривания, я использую очень впечатляющий магазин Discodex (key, value) поверх Диско-распределенной файловой системы. Однако документация Disco довольно скудная, поэтому я не могу понять, как использовать индексы Discodex в качестве вклада в работу Disco.
Возможно ли это? Если да, то как мне это сделать?
В качестве альтернативы, я думаю об этом неправильно? Было бы лучше просто сохранить эти данные в виде текстового файла в DDFS?
Ничего, кажется, что то, что я делаю, на самом деле не должно быть сделано. Возможно, это будет возможно, но было бы гораздо лучше использовать семантические теги DDFS для ссылки на капли данных.
Правильный вариант использования Discodex - хранить индексы, созданные программой Disco map-reduce, которая не требует ввода другой программы уменьшения карты.
Вы также можете использовать DiscoDB для хранения результатов одного задания, а затем использовать его как вход для другого задания. Хороший пример имеет учебник DiscoDB.