Das englische Substantiv “spam” im Spamfilter kann durch das deutsche Wort Abfall ausgedrückt werden. Ursprünglich wird es zur Bezeichnung von Fleischkonserven verwendet. Im IT-Bereich handelt es sich um unaufgeforderte elektronische Nachrichten, d.h. sie werden ohne Zustimmung des Empfängers zugestellt. Sie enthalten in der Regel Werbung. Nach Recherchen des Hamburger Statistikportals Statista lag die Zahl der Spam-Mails im Jahr 2014 weltweit bei 28 Milliarden. Dies ist ein globales Problem, das mit Hilfe eines Spam-Filters gelöst wird; konkret sollen unerwünschte Nachrichten durch ein Computerprogramm aussortiert werden. Der Absender solcher unerwünschter Mails wird als Spammer bezeichnet, der Vorgang wird als Spamming bezeichnet.

Bei der webhoster.de AG werden mit einem Spamschutzgateway bereits 88% aller eMails abgewiesen, da es sich dabei um bekannten Spam oder Virensignaturen handelt.

async Anwendungsbereiche eines Spam-Filters

Klassischerweise beschränkte sich der Einsatz eines Spam-Filters auf das Aussortieren unerwünschter E-Mails. Zu diesem Zweck wurden mit Hilfe von Algorithmen Module für E-Mail-Programme und Mailserver konstruiert. Da die Bedeutung der Werbung im Internet in der Vergangenheit jedoch immer mehr zugenommen hat, filtern neuere Programme auch Seiten. Genauer gesagt, werden Spam-Filter auch für Web-Browser, Wikis und Blogs verwendet.

Anwendungsbereiche eines Spam-Filters

a) Klassischerweise beschränkte sich der Einsatz eines Spam-Filters auf das Aussortieren unerwünschter E-Mails. Zu diesem Zweck wurden mit Hilfe von Algorithmen Module für E-Mail-Programme und Mailserver konstruiert. Da die Bedeutung der Werbung im Internet in der Vergangenheit jedoch zugenommen hat, filtern neuere Programme auch Seiten. Genauer gesagt, werden Spam-Filter auch für Web-Browser, Wikis und Blogs eingesetzt die z.B. bei Kommentarfunktionen die Inhalte überprüfen.

b) Die Bayes’sche Filtermethode. Die Bayes-Filter-Methode basiert auf der Wahrscheinlichkeitstheorie und erfordert die Mitarbeit des Benutzers, insbesondere zu Beginn der Anwendung. Wenn sie richtig eingestellt ist, ist sie der Blacklist-Methode überlegen. Der Benutzer muss empfangene Mails als Spam oder Nicht-Spam klassifizieren. Im Hintergrund lernt der Bayes’sche Filter die Regeln, ohne in die Algorithmen einzugreifen. Nach etwa 1.000 selbstsortierten Mails arbeitet der Filter selbständig. Auch bei der anschließenden Nachsortierung lernt der Bayes’sche Filter weiter.

c) Die datenbankbasierten Lösungen. Insbesondere Werbemails enthalten viele Daten, die zu einem konkreten Kontakt führen sollen. Dazu gehören insbesondere die URL einer Website und die Telefonnummer. Datenbankbasierte Lösungen verwenden Algorithmen, um diese Informationen zu suchen. Werden sie gefunden, werden die Mails aussortiert. Die Erfolgsquote solcher Verfahren kann als sehr gut bezeichnet werden. Werbemails können immer wieder und damit auf beliebig viele Arten neu gestaltet werden, wobei bestimmte Daten immer gleich bleiben.

eMail Gateway

Ein sehr effektiver Schutz vor Spam ist der Einsatz eines zusätzlichen Spamschutzgateways. In diesem Fall werden eMails zunächst an ein Serversystem gesendet, welches die eingehenden eMails auf Spam und Viren prüft und schädliche eMails direkt abweist. Die guten eMails werden dann zum Server zugestellt und dort noch einmal vom lokalen Spamschutz geprüft.

Durch das Gateway wird der Server entlastet und vor Angriffen geschützt.

async Fehlerquoten von Spamfiltern

Spam-Mails sind in der Vergangenheit immer raffinierter geworden. Daher muss sich die Anwendung des Spamfilters ständig weiterentwickeln. Dies ist mit Aufwand und Kosten verbunden, weshalb einige Anbieter für jeden Dienst Gebühren erheben. Zudem ist die Sortierung mittels Programmen mit einer Fehlerquote verbunden, die durch Schulung reduziert werden kann. Falsch-negativ-Erkennung ist, wenn Spam-Mails den regulären Posteingang erreichen; falsch-positiv-Erkennung ist, wenn normale Mails fälschlicherweise für Spam gehalten werden. Während Optimierungsmaßnahmen die Fehlerrate der Falsch-negativ-Erkennung auf zehn bis ein Prozent reduzieren, tendiert die Falsch-Positiv-Erkennung gegen Null.

Ein bekannter Spamfilter ist zum Beispiel SpamAssassin, welcher bei den meisten eMailprovidern zum Einsatz kommt.