Forum: PC Hard- und Software Spamfilter für seltsam codierte Mails


von spam (Gast)


Lesenswert?

Hallo,
ich bekomme pro Tag duzende Spammails auf meinen gmx-account. All diese 
Mails sind seltsam codiert. Thunderbird zeigt sie korrekt an, aber im 
Mailquelltext sieht das nach einer uuencode-codierung oder ähnlichem aus 
und zwar sowohl im Betreff (beginnend mit =?UTF-8) als auch im Body der 
Mail. Die Replay und Absenderadressen sind meistens bekannte Namen wie 
chip.de, spiegel.de, welt.de, amazon.com, paypal.com usw.
Wie kann ich einen Spamfilter einrichten, der solcherart codierte Mail 
sofort als Spam klassifiziert und in den Spamordner schiebt oder gleich 
löscht?
Ich melde mich dann immer auf der Website von gmx an und drücke bei 
diesen Mails auf den Spam-Button. Allerdings lernt der gmx-Spamfilter 
dadurch nicht, diese Mails als Spam zu erkennen.

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

spam schrieb:
> Wie kann ich einen Spamfilter einrichten, der solcherart codierte Mail
> sofort als Spam klassifiziert und in den Spamordner schiebt oder gleich
> löscht?

Halte ich für keine gute Idee. Ich bekomme einiges an Spam, aber > 90 % 
der Mails mit UTF-8-codiertem Header oder Body sind kein Spam, sondern 
ganz normale Mails, weil sie beispielsweise deutsche Umlaute enthalten.

von Mario M. (thelonging)


Lesenswert?

Und uuencode ist auch kein Merkmal von Spam-Mails. Damit werden z.B. 
Dateianhänge oder Grafiken in HTML-formatierten Mails übetragen.

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

Das wird auch kein uuencode sein, sondern ganz normale base64-codierte 
Inhalte. Insbesondere Grafikformate lassen sich nur so in Mails 
übertragen.

von Mario M. (thelonging)


Lesenswert?

Richtig, Base64.

von (prx) A. K. (prx)


Lesenswert?

spam schrieb:
> ich bekomme pro Tag duzende Spammails auf meinen gmx-account. All diese
> Mails sind seltsam codiert. Thunderbird zeigt sie korrekt an, aber im
> Mailquelltext sieht das nach einer uuencode-codierung oder ähnlichem aus
> und zwar sowohl im Betreff (beginnend mit =?UTF-8) als auch im Body der
> Mail.

Das sind ganz gewöhnliche Mails, in einem Format, das etwas jünger ist 
als Klartextmails nach RFC 822.

> Ich melde mich dann immer auf der Website von gmx an und drücke bei
> diesen Mails auf den Spam-Button.

Ganz schlechte Idee, wenn du allein nach dem Kriterium der Codierung 
gehst und alles wegfeuerst, das so aussieht.

: Bearbeitet durch User
von Oliver S. (oliverso)


Lesenswert?

In erster Näherung kann man dann einfach alle Mails ungelesen löschen. 
Das sorgt dann auch gleich für ein sehr aufgeräumtes Postfach.

Oliver

von hope (Gast)


Lesenswert?

spam schrieb:

> Allerdings lernt der gmx-Spamfilter
> dadurch nicht, diese Mails als Spam zu erkennen.

Das Problem kenne ich, nur von web.de.
Ich habe mir dann eine eigene HP geholt und syncron zum web-account 
laufen lassen, da trat dieses Problem nicht auf ;-)

Ich würde daher den gmx-spamfilter vergessen und den vom thunderbird 
nehmen (genau das habe ich fürs web gemacht). Den meisten derartigen 
spam frisst der Filter, der alles löscht, wo ich nur im CC: drin bin und 
nicht direkt adressiert als to: bin.

von spam (Gast)


Lesenswert?

Jörg W. schrieb:
> aber > 90 %
> der Mails mit UTF-8-codiertem Header oder Body sind kein Spam, sondern
> ganz normale Mails, weil sie beispielsweise deutsche Umlaute enthalten.

Das war mir jetzt so nicht bewusst. "Normale" Menschen schicken mir fast 
nur reine ASCII-Mails, nur von Firmen kommt seit Jahren oft eine 
HTML-Seuche. Aber diese Base64-Seuche scheint sich immer mehr zu 
verbreiten und die Spammer werden durch Wahl von Betreff und Absender 
immer raffinierter, sodass man nicht filtern kann.

Schade, somit wird E-Mail unbenutzbar und viele Leute steigen auf 
Whatsapp um und sind somit von einem Unternehmen abhängig. Aber 
komischerweise gibts bei Whatsapp fast kein Spam. Anders siehts bei 
Facebook (wozu ja auch Whatsapp gehört) aus. Dort gibts täglich von 
Facebook generierte lästige  Freudschaftsvorschläge zu asiatischen Damen 
aus dem horizontalen Gewerbe.

von (prx) A. K. (prx)


Lesenswert?

spam schrieb:
> Aber diese Base64-Seuche scheint sich immer mehr zu verbreiten

Sobald du im Header den Bereich reinen ASCII-Textes verlässt wirds 
bereits unübersichtlich. Ein einziger Umlaut im Subject oder im 
Mail-Namen führt zu Reduktion menschlicher Lesbarkeit des betreffenden 
Eintrags.

Während eine Beschränkung auf reines ASCII bei Deutsch noch leidlich 
vertretbar wäre, ist sie es bei Sprachen anderer Schreibweise nicht. 
Guck mal über den Tellerrand hinaus, die Welt ist grösser als du denkst.

> und die Spammer werden durch Wahl von Betreff und Absender
> immer raffinierter, sodass man nicht filtern kann.

Was Automaten in solchen Mails codieren, das können sie auch wieder 
decodieren. Spam-Filter wie Spamassassin tun dies natürlich.

von mailreader (Gast)


Lesenswert?

hope schrieb:
> Ich würde daher den gmx-spamfilter vergessen und den vom thunderbird
> nehmen (genau das habe ich fürs web gemacht). Den meisten derartigen
> spam frisst der Filter, der alles löscht, wo ich nur im CC: drin bin und
> nicht direkt adressiert als to: bin.

Mit dem Filter würde ich in der Firma die Hälfte der Mails von Kollegen 
nicht bekommen.

von spam (Gast)


Lesenswert?

A. K. schrieb:
> Während eine Beschränkung auf reines ASCII bei Deutsch noch leidlich
> vertretbar wäre, ist sie es bei Sprachen anderer Schreibweise nicht.
> Guck mal über den Tellerrand hinaus, die Welt ist grösser als du denkst.

Deine Überheblichkeit kannst du stecken lassen. Ich lebe hier in 
Deutschland, entsprechend kommuniziere ich nur in Deutsch und in 
Ausnahmefällen in Englisch. Da brauche ich keine seltsamen Zeichen.

A. K. schrieb:
> Was Automaten in solchen Mails codieren, das können sie auch wieder
> decodieren. Spam-Filter wie Spamassassin tun dies natürlich.

Man sieht, du hast keine Ahnung wie heutzutage Spams aufgebaut sind. 
Spamassassin und andere Software hilft da nur in wenigen Fällen weil 
diese nichts anderes tun können als eine Datenbank zu füllen und zu 
vergleichen.

von (prx) A. K. (prx)


Lesenswert?

spam schrieb:
> entsprechend kommuniziere ich nur in Deutsch und in
> Ausnahmefällen in Englisch. Da brauche ich keine seltsamen Zeichen.

Kann sein, dass Du Umlaute nicht brauchst, aber in einem Standard für 
weltweite Kommunikation sind sie einfach nur "seltsame Zeichen", wie 
griechisch, kyrillisch oder CJK. Und das Format von Mails ist nun einmal 
international definiert, nicht national.

> Man sieht, du hast keine Ahnung wie heutzutage Spams aufgebaut sind.

Stimmt. Ich pflege nur gelegentlich einen Spamassassin im Unternehmen. 
Einschliesslich eigener Filter.

> Spamassassin und andere Software hilft da nur in wenigen Fällen weil
> diese nichts anderes tun können als eine Datenbank zu füllen und zu
> vergleichen.

Bisschen mehr macht er schon. Der Bayes-Filter ist nur ein Teil davon. 
Und nicht einmal der wichtigste. Mit dem Filter von z.B. GMX hält er 
nicht mit, aber von "nur wenigen Fällen" kann keine Rede sein.

: Bearbeitet durch User
von hope (Gast)


Lesenswert?

mailreader schrieb:
> hope schrieb:
>> Ich würde daher den gmx-spamfilter vergessen und den vom thunderbird
>> nehmen (genau das habe ich fürs web gemacht). Den meisten derartigen
>> spam frisst der Filter, der alles löscht, wo ich nur im CC: drin bin und
>> nicht direkt adressiert als to: bin.
>
> Mit dem Filter würde ich in der Firma die Hälfte der Mails von Kollegen
> nicht bekommen.

Ja, bei gmx habe ich eher an einen Privataccount gedacht - da kommt 
sowas bei mir nicht bzw sehr selten vor.

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

hope schrieb:
> da kommt sowas bei mir nicht bzw sehr selten vor

Was kommt bei dir sehr selten vor?  Mails mit Umlauten?

Vor 20 Jahren war das im deutschen Bereich in der Tat noch einigermaßen 
zutreffend. Wenn es damals Umlaute gab, waren sie in der Regel als 
ISO-8859-1 codiert und in der Mail dann als quoted-printable eingefügt 
(im Volksmund "quoted unreadable" genannt), in vielen Fällen wurden 
damals die Umlaute noch als ae, oe, ue umschrieben.

Heutzutage dagegen ist UTF-8 schlicht der Standard für internationale 
Texte, und „international“ mein in diesem Sinne eben alles, was den 
US-amerikanischen Bereich von ASCII verlässt, also auch deutsch. Ich 
kenne mittlerweile auch privat nur noch wenige Mailpartner, die von sich 
aus auf Umlaute verzichten würden, und wenn Mails mit Umlauten 
reinkommen, dann sind die eben üblicherweise UTF-8.

Mit HTML-Mails hat das alles übrigens rein gar nichts zu tun. (Im 
Gegenteil: bei HTML ist ISO-8859-1 der Standardzeichensatz und HTML 
hatte schon immer eine Codierung für die darin enthaltenen 
Nicht-ASCII-Zeichen, all dieses ä usw. usf.)

von Rufus Τ. F. (rufus) Benutzerseite


Lesenswert?

Ein Spamfilter, der nicht in der Lage ist, codierte Betreffzeilen oder 
Mail-Inhalte zu "entschlüsseln", um sie dann näher zu untersuchen, ist 
kein Spamfilter, sondern einfach nur Müll.

Besorg Dir einen besseren Spamfilter, dann hast Du auch keine Probleme 
mit Betreffzeilen wie dieser hier:
1
Subject: =?UTF-8?B?w4RuZGVydW5nc25vdGl6IC0gVXBkYXRlIGdlc3RhcnRldA==?=

Das ist keine Seuche, das ist nichts besonderes, das ist vor allem kein 
Erkennungsmerkmal für Spam.

von hope (Gast)


Lesenswert?

Jörg W. schrieb:
> hope schrieb:
>> da kommt sowas bei mir nicht bzw sehr selten vor
>
> Was kommt bei dir sehr selten vor?  Mails mit Umlauten?

private Mails, bei denen ich nicht direkt adressiert bin sondern nur als 
CC:

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

hope schrieb:
>> Was kommt bei dir sehr selten vor?  Mails mit Umlauten?
>
> private Mails, bei denen ich nicht direkt adressiert bin sondern nur als
> CC:

Das war allerdings nicht das Thema des Threads …

von hope (Gast)


Lesenswert?

Ja hast du Recht!
ich habe ja auch nur auf einen Einwand geantwortet...

Für mich persönlich liegt die Lösung halt woanders als da, wo der TO sie 
sucht... ;)

von Nano (Gast)


Lesenswert?

spam schrieb:
> Die Replay und Absenderadressen sind meistens bekannte Namen wie
> chip.de, spiegel.de, welt.de, amazon.com, paypal.com usw.
> Wie kann ich einen Spamfilter einrichten, der solcherart codierte Mail
> sofort als Spam klassifiziert und in den Spamordner schiebt oder gleich
> löscht?

Warum richtest du dafür nicht einfach einen Filter in Thunderbird ein, 
der nach Absender filtert, wenn der Absender bekannt ist?

Damit dürftest du den größten Teil des Werbemülls wegfiltern können.

Aufpassen muss man lediglich bei Dienstleistern, die ihre Rechnungen und 
Newsletter mit der gleichen Absenderadresse verschicken.

Humble Bundle macht das z.B. so.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.