[bglug] Spamassassin e filtri bayesiani

Fleur @ BGLUG fleur@bglug.it
Lun 21 Apr 2008 16:53:27 CEST


> Ho verificato e nessun positivo supera i 4.1, quindi dovrebbe
> essere sufficientemente sicuro

OK, la soglia di spam la puoi provare a spostare a 6.0 (e dopo un po' di 
rodaggio puoi azzardare anche un 5.0)

> X-Spam-Status: No, score=-94.5 required=7.5 tests=BAYES_99,
>      RCVD_IN_BL_SPAMCOP_NET,USER_IN_WHITELIST autolearn=no version=3.2.3

Qui la whitelist ti frega ...
Un indirizzo (fleur@bglug.it) o un dominio (@bglug.it) inseriti 
manualmente in whitelist pesano -100.0 sul filtro; il punteggio 
dell'email che citi e' di 5.5, ma il punteggio di whitelist la abbassa a
-94.5 (Infatti 5.5-100,0=-94.5);
In questo caso il filtro bayesiano ci azzecca in pieno (BAYES_99) cioe'
al 99% per lui e' spam e pesa per 3.5 (con i settaggi di default) sul
punteggio di spam !

> Questo ha messo nel campo from un dominio in whitelist (bglug.it): meglio
> non adottare una whitelist?

meglio mettere in whitelist i soli indirizzi email (es: fleur@bglug.it); 
ultimamente tantissimi sistemi di spam usano mittenti fasulli di domini 
validi (inviano email a: tuaemail@tuodominio da: flasaemail@tuodominio)

> X-Spam-Status: No, score=2.5 required=7.5 tests=AWL,HTML_MESSAGE,
> MIME_HTML_MOSTLY,MPART_ALT_DIFF,MSGID_FROM_MTA_HEADER autolearn=no
> Questo viene dal famigerato buongiorno.com, già immesso in sa-learn
> diverse volte: che fare?

Domanda stupida, non ci si puo' cancellare dalle ml di buongiorno.com ?
Non mi risulta che facciano spam 'selvaggio' e l'opzioni di unsubscribe
dovrebbe sempre essere disponibile nel piede delle loro email, no ?

Tra l'altro il primo test 'AWL' = AutoWhiteList sembrerebbe indicare che
il mittente e' riconosciuto come un mittente 'amico' ...

> X-Spam-Status: No, score=4.5 required=7.5 tests=AWL,BAYES_99,
>      HTML_IMAGE_RATIO_04,HTML_MESSAGE,MPART_ALT_DIFF,RDNS_NONE,SUBJ_ALL_CAPS
>      autolearn=no version=3.2.3
> Anche superfighetto.it fa parte delle mie bestie nere, ma non raggiunge lo
> score. Forse la soluzione migliore è una blacklist?

Anche qui AWL gioca contro !
BAYES_99 ci prende  in pieno, altri test riconoscono del testo html 
sospetto ed l'oggetto dell'email TUTTA IN MAIUSCOLO.

Probabilmente togliendo l'indirizzo del mittente dall' AWL il punteggio 
salirebbe ad oltre il 6.0 ...

Suggerimenti finali :

- Abilita il rapporto dettagliato dei test di spam nell'email (cosi' hai 
un dettaglio dei punteggi dei singoli test !)
- Prova a ri-vedere gli indirizzi hai in white&black list

Facci sapere !

Fleur

http://spamassassin.apache.org/full/3.1.x/doc/Mail_SpamAssassin_Conf.html


Maggiori informazioni sulla lista bglug