SnEaKy
Erfahrenes Mitglied
Hallo zusammen,
ich lese mittels imap_fetchbody() den Inhalt einer Mail aus und speichere diesen als HTML-Datei. Das funktioniert soweit auch ganz gut. Im nächsten Schritt möchte ich diese HTML-Datei mit Hilfe von preg_match_all() auswerten. Das funktioniert leider nicht mit dem Erfolg, den ich gerne hätte. Nachfolgend ein Beispiel zu meinem Problem:
Zeichensatz ISO-8859-1 => Strasse / Hausnummer : Rathausstr. 3
Zeichensatz UTF8 => Strasse / Hausnummer : Rathausstr.?3
Irgendwie ist zwischen Rathausstr. und der Hausnummer noch ein anderes Steuerzeichen eingebaut, welches ich mit regulären Ausdrücken nicht wirklich abgefangen bekomme.
Inzwischen habe ich mir eine kleines Hilfsskript gebastel, damit ich wenigstens an meine Daten rankomme, die ich auslesen möchte. Leider ist damit das Zeichensatzproblem noch nicht gelöst.
Nun meine Frage. Hat jemand eine Idee, wie ich diese Steuerzeichen durch ein Leerzeichen ersetzen kann?
Vorab vielen Dank.
ich lese mittels imap_fetchbody() den Inhalt einer Mail aus und speichere diesen als HTML-Datei. Das funktioniert soweit auch ganz gut. Im nächsten Schritt möchte ich diese HTML-Datei mit Hilfe von preg_match_all() auswerten. Das funktioniert leider nicht mit dem Erfolg, den ich gerne hätte. Nachfolgend ein Beispiel zu meinem Problem:
Zeichensatz ISO-8859-1 => Strasse / Hausnummer : Rathausstr. 3
Zeichensatz UTF8 => Strasse / Hausnummer : Rathausstr.?3
Irgendwie ist zwischen Rathausstr. und der Hausnummer noch ein anderes Steuerzeichen eingebaut, welches ich mit regulären Ausdrücken nicht wirklich abgefangen bekomme.
Inzwischen habe ich mir eine kleines Hilfsskript gebastel, damit ich wenigstens an meine Daten rankomme, die ich auslesen möchte. Leider ist damit das Zeichensatzproblem noch nicht gelöst.
Nun meine Frage. Hat jemand eine Idee, wie ich diese Steuerzeichen durch ein Leerzeichen ersetzen kann?
Vorab vielen Dank.