Hallo Leute!
Dieses Thema hat mich dazu angeregt mich mal selbst an die Materie zu wagen.
Nun ich wollte nicht einfach so drauf loslegen sondern erstmal ein paar Gedanken und Ideen sammeln.
Zum ersten bin ich mir noch nicht ganz schlüssig, wie Wörter erkannt werden sollen.
Einmal gäbe es die Möglichkeit über [phpf]soundex[/phpf] und Konsorten.
Jedoch könnte man es auch mithilfe von Regulären Ausdrücken machen.
Zum zweiten wäre da die Sache der Speicherung.
Ich habe mir überlegt mehrere Möglichkeiten anzubieten:
Jetzt komme ich mal zum interessanten Teil - der "Intelligenz" des Programmes.
Es soll keine ausgereifte KI werden oder derartiges in dieser Richtung. (Naja vielleicht doch ein bisschen im seeehr viel späteren Stadium :-( )
Am Anfang wird der Speicher leer sein und keine Wörter beinhalten.
Danach kann man beginnen einige simple "Ausdrücke" einzuspeichern, es müssen nicht mal viele sein.
Der Filter sucht dann automatisch nach ähnlichen oder kombinierten Wörtern und gibt diese als Link aus, mit dem das Wort hinzugefügt werden kann.
Außerdem werden Sonderzeichen aus Wörtern herausgefiltert, um die Verschleierung von Worten zu verwehren und bestimmte Sonderzeichen werden getestet ob sie als Buchstabe in dem Wort ein Ausdruck ergeben würden (z.B. $ könnte ein "S" sein).
So wirklich intelligent ist der Filter dadurch noch nicht, aber es ist ein Anfang.
Ich hoffe ihr habt vielleicht ein paar Ideen, Anregungen oder Gedanken.
Edit: Mir ist grad aufgefallen, dass der Spamfilter von Thunderbird im Grunde ziemlich genau dem entspricht, was ich mir vorstelle...
greetz
daddz
Dieses Thema hat mich dazu angeregt mich mal selbst an die Materie zu wagen.
Nun ich wollte nicht einfach so drauf loslegen sondern erstmal ein paar Gedanken und Ideen sammeln.
Zum ersten bin ich mir noch nicht ganz schlüssig, wie Wörter erkannt werden sollen.
Einmal gäbe es die Möglichkeit über [phpf]soundex[/phpf] und Konsorten.
Jedoch könnte man es auch mithilfe von Regulären Ausdrücken machen.
Zum zweiten wäre da die Sache der Speicherung.
Ich habe mir überlegt mehrere Möglichkeiten anzubieten:
- Datenbank
- XML-Datei
- CSV-Datei
Jetzt komme ich mal zum interessanten Teil - der "Intelligenz" des Programmes.
Es soll keine ausgereifte KI werden oder derartiges in dieser Richtung. (Naja vielleicht doch ein bisschen im seeehr viel späteren Stadium :-( )
Am Anfang wird der Speicher leer sein und keine Wörter beinhalten.
Danach kann man beginnen einige simple "Ausdrücke" einzuspeichern, es müssen nicht mal viele sein.
Der Filter sucht dann automatisch nach ähnlichen oder kombinierten Wörtern und gibt diese als Link aus, mit dem das Wort hinzugefügt werden kann.
Außerdem werden Sonderzeichen aus Wörtern herausgefiltert, um die Verschleierung von Worten zu verwehren und bestimmte Sonderzeichen werden getestet ob sie als Buchstabe in dem Wort ein Ausdruck ergeben würden (z.B. $ könnte ein "S" sein).
So wirklich intelligent ist der Filter dadurch noch nicht, aber es ist ein Anfang.
Ich hoffe ihr habt vielleicht ein paar Ideen, Anregungen oder Gedanken.
Edit: Mir ist grad aufgefallen, dass der Spamfilter von Thunderbird im Grunde ziemlich genau dem entspricht, was ich mir vorstelle...
greetz
daddz
Zuletzt bearbeitet: