Vor-, Nach-, Stadt-, Straßennamen Datenbank

Binio

Erfahrenes Mitglied
Hallo ich suche für ein FH-Projekt eine/mehrere Datenbank(en) die mir alle möglichen Vornamen, Nachnamen, Städtenamen und Straßennamen liefert.
Ich habe schon mit Hilfe von opengeodb alle in deutschland vorkommenden Postleitzahlen und Stadtnamen(noch lückenhaft). Jetzt brauche ich das selbe für die anderen Bereiche. Habe bisher nur kostenpflichtige Datenbanken gefunden. Naja und das Anschreiben an die Telekom ist leider ohne zu lesen gelöscht worden :(

Daher meine Frage an euch ob ihr Solche Datenbanken besitzt und/oder wo man Sie finden bzw. herunterladen kann.

Danke schonmal im voraus

Robert
 
Hey Binio!

Worum geht's in dem Projekt? Wie flexibel bist Du in Sachen Input der Daten? Reichen die entsprechenden Infos on-demand oder brauchst Du alle statisch? Und geht's einfach nur um Auflistungen oder sollen die Namen, Städte und Straßen irgendwie zueinander in Bezug stehen -quasi: Telefonbuch oder nicht?

Greetz
Enum
 
Hi,

ich bin in Besitz einer solchen Datenbank, bzw. Einer meiner Kunden. Wenn du mir sagst, was es für ein Projekt ist, kann ich mit dem GF sprechen und ihn um den entsprechenden Datenauszug bitten. Aber es werden nur Grundlisten sein, ohne Bezug zueinander.

Die Daten kommen alle aus einer Bestellliste mit mittlerweile vielen Bestellungen, Datenbestand ist folgender:

Code:
mysql> select count(distinct(Stadt)) from Orders;
+------------------------+
| count(distinct(Stadt)) |
+------------------------+
|                  15956 |
+------------------------+
1 row in set (1 min 23.97 sec)

mysql> select count(distinct(PLZ)) from Orders;
+----------------------+
| count(distinct(PLZ)) |
+----------------------+
|                10181 |
+----------------------+
1 row in set (1 min 28.48 sec)

mysql> select count(distinct(Vorname)) from Orders;
+--------------------------+
| count(distinct(Vorname)) |
+--------------------------+
|                   995196 |
+--------------------------+
1 row in set (47.49 sec)

mysql> select count(distinct(Nachname)) from Orders;
+---------------------------+
| count(distinct(Nachname)) |
+---------------------------+
|                   2796425 |
+---------------------------+
1 row in set (1 min 1.73 sec)
 
Die Dateien sollten als CSV-Datei vorliegen. Sie müssen keine Bezug zueinander haben. Das beideutet die PLZ können einfach untereinander stehen.

10001
10002
10003
10004
etc.

Es geht nur darum das ich alle möglichen PLZs die vorkommen könnten in einer spalte habe. Die Stadtnamen dazu sind unwichtig.

Bei den Fh-Projekt geht es um die Umwandlung von Metadaten, d.h. wir haben eine Tabelle mit den Spalten a1, a2, a3, a4, a5

in Spalte a1 steht z.B.

Robert
Maria
Martin
Josef
Markus

in Spalte a2 steht z.B.

Musterstr. 26
Röntgenstr. 436
Mozartweg. 35
etc.

Jetzt wollten wir mit KI, Statistischen und Datenbanktechnischen Methoden den Spalten a1,a2,a3, etc Namen geben.
Das ist der Anfang unserer Arbeit. Der sich in Zukunft auf Geodaten beziehen wird. Aber erstmal wollen wir die schnellste und wirkungsvollste Technologie herausfinden.

Ich würde mich sehr freuen wenn du mir diese Daten zuschicken könntest, um uns bei unseren Projekt weiter zu helfen.

Sind Straßennamen (ohne Hausnummer natürlich) auch dabei ?
 
Zurück