Карта Уменьшить Рамки

1

У меня есть текстовый файл, который говорит.... Это свинья Apache, работает как шарм. Поэтому я хочу рассчитывать каждый раз, когда повторяется каждый символ. Это должно печатать... T = Count of T H = Count of H A = Count A B =.........

Can anyone tell me how do I break my words into characters into Pig.
Any help would be greatly appreciated.
Теги:

1 ответ

1
Лучший ответ
input.txt  
This is Apache pig,  
works like  
a charm  

PigScript:  
A = LOAD 'input.txt' AS line;  
B = FOREACH A GENERATE (REPLACE(line,'','\n')) AS (word:chararray);  
C = FOREACH B GENERATE FLATTEN(TOKENIZE(word,'\n'));  
D = GROUP C BY $0;  
E = FOREACH D GENERATE group,COUNT($1);  
DUMP E;  

Output:  
( ,6)  
(,,1)  
(A,1)  
(T,1)  
(a,3)
(c,2)
(e,2)
(g,1)
(h,3)
(i,4)
(k,2)
(l,1)
(m,1)
(o,1)
(p,2)
(r,2)
(s,3)
(w,1)

Ещё вопросы

Сообщество Overcoder
Наверх
Меню