Binärdaten aus Textdatei extrahieren

mk666

Mitglied
Hallo allerseits!

Ich habe hier ein kleines Problem bei dem ich einfach nicht weiter komme. Ich habe das Gefühl ich steh grad total auf der Leitung.

Also folgendes ich habe eine Textdatei in der verschiedene Arten von 'Dateien' enthalten sind. Zuerst kommt einfacher Text, dann eine HTML-Datei und zum Schluß ein PDF oder Image. Die drei Teile sollen jetzt voneinander getrennt in den passenten Formaten gespeichert werden.

Problematisch sind jetzt nur das PDF bzw. Image. Ich habe grad keinen Plan wie ich das dort rausbekomme. Den Text und das HTML habe ich per BufferedReader ausgelesen. Das PDF/Image wollte ich mir per BufferedInputStream holen, allerdings weiß ich nicht, wie ich den Anfang finden soll?

Jemand eine Idee bzw. einen Tip wie ich das lösen könnte?

Danke schonmal im vorraus.
 
Hallo,

hab ich richtig verstanden, dass du nicht weißt wo das PDF aufhört und das Image anfängt?

MFG

zEriX
 
Moin!
Wenn ich dich richtig verstehe, und nach dem html ein Bild oder ein PDF kommt,
müsste doch alles was nach dem </html> Tag steht, zu dem Bild, bzw. zu dem PDF gehören, oder? Darauf kannst du doch prüfen..

*grüssle*
MeinerEiner
 
Stimmt hab mich verlesen, ich dachte es folgt ein Image und ein PDF. Wenn nur eins von beidem kommt, kannst du das wie Meiner_Einer sagt, anhand des HTML-End-Tags sehen wann das PDF/Image anfängt. So müsste der komplette Rest der Datei dann zum PDF/Image gehören.

MFG

zEriX
 
Moin!
Wenn ich dich richtig verstehe, und nach dem html ein Bild oder ein PDF kommt,
müsste doch alles was nach dem </html> Tag steht, zu dem Bild, bzw. zu dem PDF gehören, oder? Darauf kannst du doch prüfen..

*grüssle*
MeinerEiner

Ja, so habe ich das jetzt auch gelöst. Bis einschließlich des HTML-Codes alles per Reader ausgelesen, die Zeichen mitgezählt und dann per InputStream das binäre Zeugs.
 
Zurück