Quant'e' bello imparare il pIrl

Joe Oblivian lavagetto@gmail.com
Gio 22 Dic 2005 13:37:17 CET


Ieri in chat anti ha detto "sarebbe bello avere un dizionario per  
typespeed con i vocaboli tratti dai fortunes-ViV. Forse bisognerebbe  
scriverlo in awk..."

In sostanza uno script doveva estrarre tutte le parole (e solo  
quelle) e metterle una per riga.

Io ci ho pensato un attimo e ho trovato la cosa molto 1337, tanto  
1337 che perfino un perl-illitterate come me puo' sperare di farla.
Ecco il risultato, ovviamente sotto sucaware. Se non conoscete il  
perl, vi sembreranno geroglifici, e forse anche se lo conoscete visto  
il mio livello.
Aspetto improvements. Due scelte arbitrarie: ho tagliato gli url e ho  
diviso quest'anno in quest anno (due entries) mentre ho lasciato  
intatto c'erano. Ricordate inoltre che nei files dei fortunes le  
accentate sono fatte con gli apostrofi e non con le lettere accentate.

aspetto patches.

Ecco il codice di 'words':
#!/usr/bin/perl
use utf8;
die "Usage: words <filename>\n" unless defined $ARGV[0];
open FORTUNEFILE, "< $ARGV[0]";
$"="\n";
while(<FORTUNEFILE>)
{
     chomp;
     next if(/^%$/);
     next if(/^\t\t/);
     s/^>+//;
     s/http\:\/\/[\w\/\~]*\b//g;
     s/[^\w\'\`\/\<\>\#\@]+/ /g;
     s/(\w\w)'(\w)/$1 $2/;
     s/^\s+//;
     next if(/^\s*$/);
     split(/\s+/);
     print "\n@_";
}
close FORTUNEFILE;

Ovviamente per creare un dizionario per typespeed bisogna usare  
questo programma in pipe con sort e uniq

Joe


Maggiori informazioni sulla lista palermo