Una forma rápida de entrenar spamassassin es usar el filtro antispam de gmail. Tengo varias cuentas de correo que reciben basura del orden 2000-3000 correos diarios. Estas cuentas las redirecciono a una cuenta de gmail y así me aprovecho de su filtro antispam. Esta cuenta la configuro con acceso imap y sólamente me suscribo a la carpeta Spam. Esta carpeta, /home/usuario/.mozilla-thunderbird/4zqsixke.default/ImapMail/imap.gmail.com/carpetaSpam (es la ruta que le asigna Icedove), que es donde me descargo los correos, la comparto por samba y asi puedo montarla desde todos mis servidores de correo.
Después ejecuto el comando (lo suyo es ponerlo en un cron)
nice -n 19 sa-learn -u amavis –mbox –spam Spam
para alimentar de correos a spamassassin.
Dentro de la carpeta mi cliente email (Icedove) guarda los correos, me encuentro un fichero llamado Spam y otro Spam.msf. Icedobe guarda todos los correos en un sólo archivo. Esto es porque el formato es mbox en lugar de maildir. Por eso al ejecutar el comando especifico la opcion –mbox. Con –spam le indico que los archivos a parsear son de spam y el fichero con todos los correos se llama Spam. Por la configuración de mis servidores le tengo que pasar el parámetro -u amavis, para decirle con el usuario que debería ejecutarse. Si quisiese entrenarlo con correo legítimo (es importante alimentar spamassassin con los dos tiposusaría la opción –ham. Hay otras muchas más en man sa-learn.
Si usais qmail, os recomiendo spamdyke. Es acabar con el spam de una vez por todas.