USER1,动作,AA用户2,喜剧,CC用户3,戏剧,DDUSER4,动作,AAUSER5,动作,AAuser6,喜剧,CCuser7,动作,AAuser8,喜剧,CCUSER9,戏剧,DDuser10,动作,AAuser11,动作,AAUSER12,喜剧,CC我想要 …
假设您的数据被加载到关系A,然后使用case语句检查$ 1的值,即关系A中的第二个字段,当它是'action'时,或者'comedy'用'bb'替换值'aa'或者否则使用默认值$ 2
B = FOREACH A GENERATE $0,$1, (CASE $1 WHEN 'action' OR 'comedy' THEN REPLACE($2,'aa','bb') ELSE $2 END);