Djunix
Mitglied
Hallo,
ich habe folgendes Problem:
Ich habe eine Datei in der mehrere Tausend Datensätze stehen. Diese Datensätze beinhalten unter anderem Telefonnummern. Diese Telefonnummern sollen mit den Telefonnummern aus einer Stammdaten-xml soweit anonymisiert werden das in den Stammdaten mindestens 5 mögliche Nummern übrig bleiben.
Beispiel:
Nummer aus aktuellem Datensatz: 0123456789
Nummern aus der Stammdatendatei:
0123456789
0123456788
0123456787
0123456786
0123456785
hier müsste man nur eine Stelle wegstreichen (012345678x) damit 5 Möglichkeiten übrig bleiben.
Das Problem hierbei ist das das ganze möglichst schnell geschehen soll. Deshalb habe ich mir überlegt die Stammdaten in einen AVL-Baum bzw. eine Map zu packen.
Mein Problem ist das ich nicht weiss wie ich das anstellen soll die Map so zu durchlaufen das ich herausbekomme wieviele Möglichkeiten es gibt.
Der Inhalt einer Map wird ja über einen Schlüssel identifiziert (z.B:"0123456789"). jetzt müsste ich aber irgendwie die möglichkeit haben nach "012345678" zu suchen sodass er mir alle Elemente ausgibt in deren Schlüsel eine "012345678" drin vorkommt.
Das ganze ist nicht ganz einfach und dadurch auch schwehr zu erklären, ich hoffe aber mal das es trotzdem jemanden gibt der mir da weiterhelfen kann.
ich habe folgendes Problem:
Ich habe eine Datei in der mehrere Tausend Datensätze stehen. Diese Datensätze beinhalten unter anderem Telefonnummern. Diese Telefonnummern sollen mit den Telefonnummern aus einer Stammdaten-xml soweit anonymisiert werden das in den Stammdaten mindestens 5 mögliche Nummern übrig bleiben.
Beispiel:
Nummer aus aktuellem Datensatz: 0123456789
Nummern aus der Stammdatendatei:
0123456789
0123456788
0123456787
0123456786
0123456785
hier müsste man nur eine Stelle wegstreichen (012345678x) damit 5 Möglichkeiten übrig bleiben.
Das Problem hierbei ist das das ganze möglichst schnell geschehen soll. Deshalb habe ich mir überlegt die Stammdaten in einen AVL-Baum bzw. eine Map zu packen.
Mein Problem ist das ich nicht weiss wie ich das anstellen soll die Map so zu durchlaufen das ich herausbekomme wieviele Möglichkeiten es gibt.
Der Inhalt einer Map wird ja über einen Schlüssel identifiziert (z.B:"0123456789"). jetzt müsste ich aber irgendwie die möglichkeit haben nach "012345678" zu suchen sodass er mir alle Elemente ausgibt in deren Schlüsel eine "012345678" drin vorkommt.
Das ganze ist nicht ganz einfach und dadurch auch schwehr zu erklären, ich hoffe aber mal das es trotzdem jemanden gibt der mir da weiterhelfen kann.