私には豚の仕事があり、その中の単語を見つけてデータをフィルタリングする必要があります。
これがスニペットです
A = LOAD '/home/user/filename' USING PigStorage(',');
B = FOREACH A GENERATE $27,$38;
C = FILTER B BY ( $1 == '*Word*');
STORE C INTO '/home/user/out1' USING PigStorage();
Cを見つけているときにエラーが3行目にあります。私も使用してみました
C = FILTER B BY $1 MATCHES '*Word*'
また
C = FILTER B BY $1 MATCHES '\\w+Word\\w+'
MATCHES
は正規表現を使用します。やったほうがいい ... MATCHES '.*Word.*'
代わりに。
これらは例です ここ 単語「Apache」を見つける。