Bewertung von Soundex Suchergebnissen

Hubivan

Mitglied
Hi ist es möglich die mit SOUNDEX (oder Koelner Verfahren) gefundenen Begriffe irgenwie nach ihrer Relevanz zu Bewerten?

Der Code für folgende Worte ist ja immer
Häublein : 0156
Heublein : 0156
Haeublein : 0156
Hoiblein : 0156
Hoibline : 0156
Haeubline : 0156

Wobei natürlich die ersten 3 eher relevant erscheinen als die letzen drei... wenn man davon ausgeht, das der Suchbegriff "Heublein" ist.
Aber da der Computer ja keinen "gesunden Menschenverstand" besitzt muss man ihm das ja irgendwie anders beibiegen... jemand ne Idee?

Falls jemand das Kölner Verfahren nicht kennt, hier ein Wikipedia-Link dazu
http://de.wikipedia.org/wiki/Kölner_Verfahren
 
Mit Soundex oder dem Kölner Verfahren lassen sich nur die phonetischen Merkmale eines Wortes ermitteln. Wörter mit denselben Werten klingen also nur ähnlich, können aber auch völlig unterschiedlich geschrieben sein. Zudem untersucht Soundex nur anhand der englische Aussprache, was für deutsche Wörter natürlich nicht geeignet ist. Dies kann dann zu ungewollten Ergebnissen führen (siehe Abschnitt „Kritik an dem Verfahren“ des Wikipedia-Soundex-Artikels).
 
Ok, das hatte ich mir schon gedacht.

Hat jemand von euch ne Idee wie ich die gefunden gleichklingenden Worte eventuel bewerten könnte?

Spontan fällt mir dazu noch die Levenstein-Damerau Distanz ein, wäre das dafür was?
 
Zurück