|
|
 |
 |
 |
 |
 |
Bayesiaanse classificatie is gebaseerd op de statistische theorie van de Engelse wetenschapper T. Bayes. Het is een oude technologie die echter zeer effectief is bij het detecteren van Spamberichten.
Om te beginnen weet het filter niet wat Spam is en wat niet. Alle binnenkomende e-mail wordt daarom als 'niet' Spam geclassificeerd. Wanneer u een bericht ontvangt dat u ervaart als een Spambericht, dan vertelt u dit tegen het filter (SpamWeed). SpamWeed analyseert vervolgens het bericht.
U ontvangt bijvoorbeeld een e-mail bericht met de volgende woorden:
Click, Here, free, debt, consolidation, credit, card
Al deze woorden worden nu door het filter (SpamWeed) als Spam gezien en als zodanig in de database geplaatst. Vervolgens ontvangt u een bericht met de volgende woorden:
Here, credit, card, Norman, Dutch...
Het filter (SpamWeed) zal vervolgens het bericht analyseren en constateren dat het bericht 'Spam woorden' bevat (Here, credit en card). Volgens een bepaalde formule worden er punten toegekend aan het bericht en wordt een score berekend. Aan de hand van deze score bepaalt SpamWeed of het bericht als Spam geclassificeerd dient te worden. In ons voorbeeld is de score zodanig dat dit bericht als Spam wordt geclassificeerd.
Dit e-mail bericht was voor u echter géén Spambericht. Door het classificeren van dit e-mail-bericht als géén Spam, leert het filter van u. In dit geval vertelt u dat de woorden in het e-mailbericht geen Spamwoorden zijn.
De database bevat nu de volgende woorden:
Woorden die als Spam zijn geclassificeerd: Click, free, debt, consolidation
Neutrale woorden: Here, credit, card
(komen zowel in Spam- als geen Spamberichten voor)
Woorden die niet als Spam zijn geclassificeerd: Norman, Dutch
(komen alleen in niet Spamberichten voor)
De formule wordt gebruikt om deze informatie te combineren en de score te berekenen. Deze score bepaalt of het bericht een Spambericht is of niet.
De Bayesiaanse filtertechniek is voor Spam vechters dé technologie. Bayesiaanse filters leren continu door het gebruik. Wanneer het filter voor het eerst wordt gebruikt is deze niet slim en werkt deze zelfs niet zoals gewenst. Echter na een aantal dagen, zult u merken dat het filter steeds slimmer wordt en meer en meer het gewenste resultaat bereikt. Het is op dit ogenblik de enige techniek die met de gebruiker meegroeit. De berichten die u als Spam ervaart zijn namelijk niet per definitie Spam voor iedereen!
|
 |
 |
 |
 |
|