Hallo,
ich bin dabei ein Progrämmchen zu schreiben, dass extrem viele (einige Millionen) .html files von einem Server lädt und dann lokal bei mir abspeichert.
Ich habe zwei Problemchen:
1. Die html Datei ist im Zeichensatz iso-8859-2 und ich möchte sie am liebsten in UTF-8 umwandeln oder java dazu bewegen auch diesen Zeichensatz zu nutzen. Bis jetzt verschwinden bei mir alle Sonderzeichen und werden durch ein Fragezeichen ersetzt.
2. Welche Methode ist am effizientesten, um eine solche Datei zu schreiben?
Ich nutze zur Zeit den Filewriter. Kann ich dem oder einer anderen Klasse den zum schreiben zu nutzenden Zeichensatz übergeben?
Kann ich evtl das Problem des Zeichensatzes durch byteweises einlesen oder ähnlichem umgehen?
Vielen Dank und ein schönes Wochenende
Niklas
ich bin dabei ein Progrämmchen zu schreiben, dass extrem viele (einige Millionen) .html files von einem Server lädt und dann lokal bei mir abspeichert.
Ich habe zwei Problemchen:
1. Die html Datei ist im Zeichensatz iso-8859-2 und ich möchte sie am liebsten in UTF-8 umwandeln oder java dazu bewegen auch diesen Zeichensatz zu nutzen. Bis jetzt verschwinden bei mir alle Sonderzeichen und werden durch ein Fragezeichen ersetzt.
2. Welche Methode ist am effizientesten, um eine solche Datei zu schreiben?
Ich nutze zur Zeit den Filewriter. Kann ich dem oder einer anderen Klasse den zum schreiben zu nutzenden Zeichensatz übergeben?
Kann ich evtl das Problem des Zeichensatzes durch byteweises einlesen oder ähnlichem umgehen?
Vielen Dank und ein schönes Wochenende
Niklas