Eingang von XML & UTF8 ...

Selbst in diesem Fall besteht meines Erachtens kein Problem.

Source XML Dokument wird ausgelesen (XML Libary) -> Sonderzeichen werden dekodiert(XML Libary) -> Daten werden sortiert und aufgeteilt (Splitter) -> Sonderzeichen werden enkodiert (XML Libary) -> Ziel XML Dokumente werden geschrieben (XML Libary).

Die Strategie sieht so aus, dass die Zieldateien Einheit für Einheit geschrieben werden, um nicht zu viel Resourcen zu verbrauchen, denn es können quasi beliebig große XML-Dateien zu verarbeiten sein. Daher verwendet die Anwendung SAX.
Welche XML-Library würdest Du zusätzlich empfehlen für das enkodieren bzw. partiellen schreiben der Dateien? Ich hatte schon gesehen es gibt offenbar im DOM4J einen XMLWriter, aber kann der auch partiell schreiben? Kennst Du dafür Beispielcode?
 
Hallo,

na wenn du einfach nur das XML Dokument in mehrere Fragmente aufsplitten willst kannst du auch XSLT verwenden (TransformerFactory ...) In deinem Stylesheet kannst du dann genau steuern, ob und wie Entity Referenzen aufgelöst werden sollen.

Gruß Tom

Leider reicht für XLST nicht die Zeit sich einzuarbeiten.
Aber mal abgesehen davon, wie arbgeit XLST eigetnlich bezüglich Resourcen? liest es erst alles ein und macht dann etwas daraus oder passiert dies hier auch resourcenschonend häppchenweise?
 
Zurück