/ Forside / Teknologi / Internet / E-Mail / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
E-Mail
#NavnPoint
o.v.n. 20481
miritdk 16341
Klaudi 15149
refi 14168
dk 5555
tedd 5322
webnoob 5265
BjarneD 5014
emesen 4154
10  bentjuul 3460
[Evolution]Spamfiltrering med bogofilter o~
Fra : Martin Heller


Dato : 08-12-03 20:43

Jeg filtrerer i øjeblikket min mail vha meddelelsesregler i
Evolution, spamassassin og bogofilter. I dag har jeg indtil nu
modtaget 49 spammails, hvoraf to er røget i min indbakke og
resten er filterert fra. De to spammails var identiske bortset
fra afsenderadressen.

Jeg har brugt spamassassin og bogofilter i et par måneder nu, og
indlæring på alt indkommende spam. Hvor effektivt skal jeg regne
med at frasorteringen kan blive uden at der kommer for mange
falske hits (har indtil nu ikke oplevet det)?

De spammails, som slipper igennem er typisk html-mails, som ikke
indeholder andet end et par linier tekst og et link til en eller
anden hjemmeside. Er der en særlig smart måde at frasortere
sådanne mails på uden at risikoen for at frasortere "rigtige"
mails bliver for stor?

Med andre ord: Skal jeg stille mig tilfreds med at <5% af den
spam jeg modtager kommer i indbakken og kan jeg risikere at jeg
på et tidspunkt får "overtrænet" spamassassin og bogofilter så
også legitim post bliver sorteret fra? Eller kan jeg roligt
fortsætte med at køre indlæring på alt indkommende spam?

 
 
Jacob Bunk Nielsen (09-12-2003)
Kommentar
Fra : Jacob Bunk Nielsen


Dato : 09-12-03 00:06

Martin Heller <mr_hellerFJERN_SPAM@yahoo.dk> writes:

> Jeg har brugt spamassassin og bogofilter i et par måneder nu, og
> indlæring på alt indkommende spam. Hvor effektivt skal jeg regne
> med at frasorteringen kan blive uden at der kommer for mange
> falske hits (har indtil nu ikke oplevet det)?

Jeg startede med at træne min SpamAssassin på et par tusinde spams og
ca. samme antal hams. Jeg vil tro den spiser 99+% af mit spam. Det er
meget sjældent at der slipper en igennem efterhånden.

> Med andre ord: Skal jeg stille mig tilfreds med at <5% af den
> spam jeg modtager kommer i indbakken og kan jeg risikere at jeg
> på et tidspunkt får "overtrænet" spamassassin og bogofilter så
> også legitim post bliver sorteret fra? Eller kan jeg roligt
> fortsætte med at køre indlæring på alt indkommende spam?

Du træner den vel også med ham, ikke? Så lærer den også at kende
hvilke mails der ikke er spam. Jeg er et på et par engelsksprogede
lister, og på trods af at det meste af det mail jeg udveksler foregår
på dansk og det meste af det spam jeg får er på engelsk, så har den
endnu ikke spist nogle mails fra de der lister.

Har du læst om hvordan bayesian filtering virker? Hvis ikke, så check
Paul Graham's "A plan for spam" på <http://www.paulgraham.com/spam.html>.

--
Jacob - www.bunk.cc
There's no use in having a dog and doing your own barking.

Martin Heller (09-12-2003)
Kommentar
Fra : Martin Heller


Dato : 09-12-03 22:46

Jacob Bunk Nielsen skrev i
<spamdrop+m3llpm9agj.fsf@paven.bunk.cc>:

> Har du læst om hvordan bayesian filtering virker? Hvis ikke, så
> check Paul Graham's "A plan for spam" på
> <http://www.paulgraham.com/spam.html>.

Tak for linket. Det er interessant læsning. Jeg havde ikke
overvejet at jeg også skulle lære filtrene hvad der /ikke/ er
spam.


Søg
Reklame
Statistik
Spørgsmål : 177550
Tips : 31968
Nyheder : 719565
Indlæg : 6408823
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste