Sprint
Erfahrenes Mitglied
Hallo zusammen,
ich stehe hier vor dem Problem, Übereinstimmungen zwischen Werten in verschiedenen Datensätzen zu finden. Bei aktuell 25000 Datensätzen ist eine Live Suche vermutlich zu aufwendig und zeitintensiv. Außerdem verfügt MySQL ja meines Wissens nicht über entsprechende Werkzeuge. Darum hatte ich mir überlegt, für die wichtigsten Felder wie Name, Straße, Ort einen "Wert" zu errechnen und nur noch darüber zu vergleichen. Ich hatte früher bei Clipper mal mit Soundex zu tun, aber das ist aufgrund der Nähe zur englischen Sprache vermutlich ungeeignet.
Es sollten auch leichte Abweichungen gefunden werden, da aufgrund von zwingenden Übereinstimmungen mit dem BZSt die jeweilige Schreibweise eingehalten werden muß. Es sollten also z.B. folgende Varianten gefunden werden:
C Iglo Langnesias
Cl Iglo Langnesias
Calle Iglo Langnesias
Calle Iglo-Langnesias
Kennt jemand eine entsprechende Funktion oder Routine, die sowas kann? Oder wie sonst könnte man sowas realisieren?
ich stehe hier vor dem Problem, Übereinstimmungen zwischen Werten in verschiedenen Datensätzen zu finden. Bei aktuell 25000 Datensätzen ist eine Live Suche vermutlich zu aufwendig und zeitintensiv. Außerdem verfügt MySQL ja meines Wissens nicht über entsprechende Werkzeuge. Darum hatte ich mir überlegt, für die wichtigsten Felder wie Name, Straße, Ort einen "Wert" zu errechnen und nur noch darüber zu vergleichen. Ich hatte früher bei Clipper mal mit Soundex zu tun, aber das ist aufgrund der Nähe zur englischen Sprache vermutlich ungeeignet.
Es sollten auch leichte Abweichungen gefunden werden, da aufgrund von zwingenden Übereinstimmungen mit dem BZSt die jeweilige Schreibweise eingehalten werden muß. Es sollten also z.B. folgende Varianten gefunden werden:
C Iglo Langnesias
Cl Iglo Langnesias
Calle Iglo Langnesias
Calle Iglo-Langnesias
Kennt jemand eine entsprechende Funktion oder Routine, die sowas kann? Oder wie sonst könnte man sowas realisieren?