XML einlesen von URL mit JDOM: Umlaute gehen kaputt

Hallo Zusammen,

folgendes Problem:

Ich lese derzeit XML von einer URL ein. Das XML sieht folgermaßen aus:

Code:
<?xml version="1.0" encoding="utf-8"?>
<meinTest>
  <item>
    <meinName><![CDATA[Meine Umlaute ä ö ü é]]></meinName>
  </item>
</meinTest>

Ich lese das XML mit JDOM ein:

Code:
String htmlOutput 		= "";
URL url 				= null;
Document doc 			= null;
SAXBuilder builder 			= new SAXBuilder();
XMLOutputter xmlOutputter 	= new XMLOutputter(); 
ByteArrayOutputStream bais 	= new ByteArrayOutputStream();

url = new URL(urlString);
doc = builder.build(url);

Source     xmlFile    	= new JDOMSource( doc ); 
JDOMResult htmlResult 	= new JDOMResult();
Transformer transformer = TransformerFactory.newInstance().newTransformer( 
    					new StreamSource(xslFilePath) );
transformer.transform(xmlFile, htmlResult);
xmlOutputter.output(htmlResult.getDocument(),bais);
htmlOutput 		= bais.toString();

Also wie ihr seht mache ich noch mit XSLT HTML draus, aber da liegt nicht das Problem.

Beim Einlesen haut er mir schon die Umlaute weg. Sehe ich durch die Ausgabe mit

Code:
xmlOutputter.output(doc, System.out);

Dort steht dann folgendes:

Code:
Meine Umlaute?? ??

Wie kann ich die Umlaute erhalten?

Habe auch bereits hier im Forum gesucht und auch etwas gefunden, allerdings nie eine Lösungm it JDOM.

Kann jemand helfen?

vielen Dank im Voraus.

Viele Grüße
Oliver
 
Zuletzt bearbeitet:
Code:
URL url = new URL("http://www.webnobis.com");
InputSource in = new InputSource(url.openConnection().getInputStream());
in.setEncoding("UTF-8");
Document doc = DocumentBuilderFactory.newDocumentBuilder().parse(in);
// Dein weiterer Code

Ob die Umlaute überhaupt mit UTF-8 kommen, weiß ich nicht, normalerweise mußt Du ISO-8859-1 für ä, ö, ü nehmen.
 
Zuletzt bearbeitet:
Zurück