付録についていた count_word.pl

日経 Linux 2011-05 を参考に Hadoop を実験してみましたが
なぜかエラーになるので
一度ソースを見てみました
結果、付録DVDに入っていたスクリプトには
#!/usr/bin/perl
#use strict;
my %words;
while () {
chomp $_;
undef %words;
my @words = split ( /\s+/, $_ );
foreach $s ( @words ) {
$s =~ tr/A-Z/a-z/;
$s =~ s/\W+//g;
$s =~ s/([\w\d]+)/$1/g;
unless ( $s =~ /\w{4,}/ ) { next; }
print ($s . “\t” . 1 . “\n” );
}
}
となっていましたが
書籍のページでは
#!/usr/bin/perl
use strict;
my $s;
while () {
chomp $_;
my @words = split ( /\s+/, $_ );
foreach $s ( @words ) {
$s =~ tr/A-Z/a-z/;
$s =~ tr/a-z//cd;
if ( $s =~ /[a-z]{4,}/ ) {
print ($s . “\t” . 1 . “\n” );
}
}
}
となっています
コマンドで書き換えたような記憶はないので、
ソースそのものが違っているような気がします….
count_word.pl*
となっているので、他にも要因があるのかもしれません

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です