dom4j: Modifizieren einer XML - geschützte Leerzeichen ( ) wird zu Â_

Sabine Adler

Grünschnabel
Hallo,

ich habe unter Verwendung von dom4j ein Programm geschrieben, dass in einer bestehenden XML-Datei nach einem bestimmten Element sucht und dort den Wert verändert. Soweit so gut, wird erledigt.
Aber bei genauerem Vergleich mit der vorherigen Version (z.B. WinMerge) fällt auf, dass doch ein paar Dinge geändert wurden. Wirklich störend für mich ist dabei, dass die durch   gekennzeichneten geschützten Leerzeichen durch Â_ (Unterstich = Leerzeichen) ersetzt wurden.
Mir ist bekannt, dass DOM und somit auch dom4j ebenso wie jdom und ähnliches die Referenzen nicht speichert und dies daraus resultiert, aber ist vielleicht trotzdem jemandem eine Möglichkeit bekannt dies zu erhalten?

Danke schon mal
 
Ich würde hier auf einen typischen Zeichensatzfehler tippen ... das Â_ ist vermutlich ein UTF16-Unicode Char der aus einem 8Bit ANSI oder Win-1 Char fehlerhaft übersetzt wird.
 
Ja es war tatsächlich zunächst ein Fehler bezüglich der Zeichensätze. Ursprungsdokument ist ANSI.
Habe ich entsprechend geändert, aber weiterhin ist mein Problem, dass   durch Leerzeichen ersetzt wird, was es ja schließlich bedeutet. Ich würde dies aber weiterhin als diese Zeichenfolge im Dokument benötigen...
 
Zurück