Hubivan
Mitglied
Hallo,
Ich habe folgendes Problem, in einer Kundendatenbank soll über die Kundennummer eine unscharfe Suche durchgeführt werden. Um z.B. auch Kunden zu finden die ihre Nummer nicht ganz wissen, oder sie auf der Überweisung E-Mail was auch immer...
falsch angegeben haben z.B. Zahlendreher o.ä.
Da die Kundennummern nur aus Ziffern bestehen, kommt eine unscharfe Suche mit SOUNDEX nicht in Frage, da dieser Alogrithmus ja für Wörter gedacht ist.
Ich habe schon überlegt, die Kundennummern mittels Levenshtein-Distanz zu vergleichen, aber das würde wohl zu lange dauern, da das dann ja mit jedem einzelnen Datensatz gemacht werden müsste und das wiederum würde bei fast 4 Millionen Kunden etwas lange dauern oder?
Die zu verwendente Datenbank wird vermutlich Oracle sein, MySQL steht aber auch zur Debatte. Bei der ganzen Sache handelt es sich mehr oder weniger um ein "Versuchsprojekt", das nicht zwingend zu dem Resultat führen muss, dass die Suche sinnvoll ist bzw in endlicher Zeit durchführbar ist.
Ich habe folgendes Problem, in einer Kundendatenbank soll über die Kundennummer eine unscharfe Suche durchgeführt werden. Um z.B. auch Kunden zu finden die ihre Nummer nicht ganz wissen, oder sie auf der Überweisung E-Mail was auch immer...
falsch angegeben haben z.B. Zahlendreher o.ä.
Da die Kundennummern nur aus Ziffern bestehen, kommt eine unscharfe Suche mit SOUNDEX nicht in Frage, da dieser Alogrithmus ja für Wörter gedacht ist.
Ich habe schon überlegt, die Kundennummern mittels Levenshtein-Distanz zu vergleichen, aber das würde wohl zu lange dauern, da das dann ja mit jedem einzelnen Datensatz gemacht werden müsste und das wiederum würde bei fast 4 Millionen Kunden etwas lange dauern oder?
Die zu verwendente Datenbank wird vermutlich Oracle sein, MySQL steht aber auch zur Debatte. Bei der ganzen Sache handelt es sich mehr oder weniger um ein "Versuchsprojekt", das nicht zwingend zu dem Resultat führen muss, dass die Suche sinnvoll ist bzw in endlicher Zeit durchführbar ist.
Zuletzt bearbeitet: