Name, Vorname nur einmal ausgeben, auch wenn Straße unterschiedlich geschrieben

@tombe:
Ich halte es für ein datenschutzrechtliches Leck, wenn "ähnliche" Informationen aufgrund Levenshtein-Distanz gezeigt/empfohlen werden. So kann ich mich mit Meier/Schulz/Schmidt und Klingeknopfnamen/Straße/PLZ durcharbeiten und die DB auslesen.

Es ist für für die DB nicht grad eine ressourcenschonende Lösung, aber ich würd die doppelte Anmeldung zulassen, und zB auf Basis von Nichtnutzung nach 1 Jahr löschen.. Der Kunde sollte sich die Daten einfach mal merken. Wenn er es nicht tut, ist er selbst schuld, dass er nach zB 50 Bestellungen keinen Rabatt bekommt.

mfg chmee
 
@chmee: Gut, generell ist der Datenschutz ein Punkt für dich.

Aber angenommen es gibt jemand ein: Klaus Müller - Hauptstr. 25 - 12345 Frankfurt und es gibt für den Namen Müller mit der Postleitzahl 12345 bereits eine Hauptstrasse und eine Hauptstraße, dann würde ich eben nur die Straßennamen anzeigen mit dem Hinweis das es eben diese ähnlich lautenden Einträge gibt und man entscheiden soll welcher davon genommen werden soll.

Es soll nicht angezeigt werden das es bereits einen Klaus Müller mit anderer Adresse oder eine Sabine Müller in der gleichen Straße gibt. Ist es dann auch ein Verstoß gegen den Datenschutz

Gruß Thomas
 
Angenommen, ich heisse Chmielarz :D, bin ein böser DB-Ausleser und gebe dort per php-script alle Möglichkeiten von (Nachname) Ahrens bis Zuckowsky mit den Straßennamen Argusdamm bis Zylinderweg und PLZ 09000 bis 98000 ein. Das Ergebnis wäre, die Seite gibt mir aus, ob und wer dort schon eingetragen ist, allein aufgrund der "Gefunden,Ähnlich,Auswahl"-Aussage. Damit weiss ich, dass jene/ähnliche Person dort angemeldet ist und Waren bezieht, ob nun Bürokram oder Sexartikel..

Datamining bzw. Profilerstellung.. Ist das Beispiel verständlich?
mfg chmee
 
Angenommen, ich heisse Chmielarz :D, bin ein böser DB-Ausleser und gebe dort per php-script alle Möglichkeiten von (Nachname) Ahrens bis Zuckowsky mit den Straßennamen Argusdamm bis Zylinderweg und PLZ 09000 bis 98000 ein.

Na dann viel Spaß. Aber woher weißt du welche Namen es zwischen Ahrens und Zuchowsky denn alle gibt?

Mal angenommen ich habe eine Datenbank im Hintergrund laufen, in der alle Strassen, Postleitzahlen und Orte von Deutschland enthaten sind. Alle Straßen sind in dieser DB mit "ß" geschrieben und somit zwangsläufig auch nicht als "Str." abgekürzt.
Wenn nun jemand eine Strasse abkürzt oder eben mit "ss" schreibt. Warum soll ich das dann nicht mit der DB abgleichen können und einen alternativen Vorschlag machen? Nichts anderes macht meine Idee im Grunde genommen auch.
Bei einem Online Routenplaner werden die Eingaben auch abgeglichen (auch wenn es hier nr um die Ortsbezeichnung geht).

Wäre vielleicht nicht schlecht wenn sich der Ersteller dieses Beitrags nochmal zu Wort melden würde, dann wüßten wir auch mal wo und wie das überhaupt zum Einsatz kommen soll.
 

Anhänge

  • adresse.JPG
    adresse.JPG
    18,2 KB · Aufrufe: 14
(0) Es ist ein hypothetisches Beispiel mit viel automatisiertem Zeitaufwand.
(1) Telefonbuch-CDs sind ja ein alter Hut, das lässt sich vorzüglich kombinieren :D Online-DBs kann man dafür auch mißbrauchen.
(2) Straßennamen sind auch nicht das eigentliche Thema. Eine DB-Tabelle mit allen möglichen Straßennamen ist eine Sache, diese macht Sinn, um behiflich zu sein beim Ausfüllen des Formulars.
(3) Eine andere Sache ist es (und so versteh ich die Folgeproblematik hier), wie man Duplikate vermeiden will und ob man dem Quasi-Neukunden beim Ausfüllen Daten aus der Tabelle der existierenden Kunden herausrücken sollte ("Sind Sie nicht Herr ... aus ... mit der ID ...?").

mfg chmee
 
Moin chmee und tombe,

ich finde eure Diskussion durchaus bereichernd und notwendig.
Ich denke allerdings von dem, was der Beitragsersteller NTDY glaubt als vereinfachtes datenbank-geeignetes Abbild der Realität verwenden zu können, habt ihr schon vieles verdrängt.

Wenn die Tabellen bzw. letzten Endes die Bestellerfassung erlaubt, dass der Bestellende auch ohne eindeutig identifizierbaren Schüssel ("Kundennummer", "XY-ID") sich mal mit dem Vornamen "Hans-Joachim", mal als "HaJo" ; mal in der "Hauptstr." mal in der "Hauptstrasse" eintragen kann...
Ja hey! Dann bleibt die Loseblattsammlung eben etwas, über das eine Halbtagskraft manuell drübergucken muss. Mit den drei Hilfsmitteln Bleistift, Radiergummi und einer Münze mit Kopf und Zahl oder ähnlich eindeutigen Schicksalsentscheidungen.

Dazu wurde doch schon vorhin alles gesagt:
ist richtig. wahrscheinlich muss man tatsächlich die daten erstmal aufbereiten und normalisieren, bevor sie zu gebrauchen sind.

Wenn der mögliche Nutzen einer Ich-dampf-das-ein-mit-Levenshtein-Aktion ist, dass ich danach zwar 50% der (inhaltlich) identischen Sätze zusammengedampft habe, allerdings dafür bei auch nur 5% der Datensätze etwas falsch zugeordnet habe (Datenverlust bei Kunden/Rechnungsdaten)...

--> an dieser Stelle sollte das Thema "Ich bereinige die Symptome" vom Tisch sein.
Einzige echte Alternative: Gehe zurück auf Los, mach eine Datenbank daraus und fertig.

Grüße
Biber
 
Vielen Dank für all die wunderbaren Antworten.

Die Datenbank wurde von einem Kollegen irgendwann einmal programmiert und konzeptuell nicht zu Ende gedacht.
Ich muss nun den Müll dazu wegräumen. Oder vielleicht kann ich es auch gleich umprogrammieren und einen eindeutigen Schlüssel wie "Email-Adresse" oder eine Schlüssel-Kombi aus "Name,Vorname,Geburtstag" erzeugen.

Vielen Dank nochmal.
 
Hi,

also wenn ich die Aufgabe richtig verstanden habe
wäre für mich die
ein:
SELECT DISTINCT Name,Vorname FROM blah
die beste Lösung.

Lieber Gruss
 
Zurück