Binärdaten aus Textdatei extrahieren

mk666 · 20. August 2007

Hallo allerseits!

Ich habe hier ein kleines Problem bei dem ich einfach nicht weiter komme. Ich habe das Gefühl ich steh grad total auf der Leitung.

Also folgendes ich habe eine Textdatei in der verschiedene Arten von 'Dateien' enthalten sind. Zuerst kommt einfacher Text, dann eine HTML-Datei und zum Schluß ein PDF oder Image. Die drei Teile sollen jetzt voneinander getrennt in den passenten Formaten gespeichert werden.

Problematisch sind jetzt nur das PDF bzw. Image. Ich habe grad keinen Plan wie ich das dort rausbekomme. Den Text und das HTML habe ich per BufferedReader ausgelesen. Das PDF/Image wollte ich mir per BufferedInputStream holen, allerdings weiß ich nicht, wie ich den Anfang finden soll?

Jemand eine Idee bzw. einen Tip wie ich das lösen könnte?

Danke schonmal im vorraus.

mk666 · 21. August 2007

Niemand eine Idee? Bin bisher leider noch auf keine für mich zufriedenstellende Lösung gekommen.

Anime-Otaku · 21. August 2007

Libs benutzen?

http://www.google.de/search?hl=de&q=pdf+lib+java&btnG=Suche&meta=

zerix · 21. August 2007

Hallo,

hab ich richtig verstanden, dass du nicht weißt wo das PDF aufhört und das Image anfängt?

MFG

zEriX

MeinerEiner_80 · 21. August 2007

Moin!
Wenn ich dich richtig verstehe, und nach dem html ein Bild oder ein PDF kommt,
müsste doch alles was nach dem </html> Tag steht, zu dem Bild, bzw. zu dem PDF gehören, oder? Darauf kannst du doch prüfen..

*grüssle*
MeinerEiner

zerix · 21. August 2007

Stimmt hab mich verlesen, ich dachte es folgt ein Image und ein PDF. Wenn nur eins von beidem kommt, kannst du das wie Meiner_Einer sagt, anhand des HTML-End-Tags sehen wann das PDF/Image anfängt. So müsste der komplette Rest der Datei dann zum PDF/Image gehören.

MFG

zEriX

mk666 · 22. August 2007

MeinerEiner_80 hat gesagt.:
Moin!
Wenn ich dich richtig verstehe, und nach dem html ein Bild oder ein PDF kommt,
müsste doch alles was nach dem </html> Tag steht, zu dem Bild, bzw. zu dem PDF gehören, oder? Darauf kannst du doch prüfen..

*grüssle*
MeinerEiner

Ja, so habe ich das jetzt auch gelöst. Bis einschließlich des HTML-Codes alles per Reader ausgelesen, die Zeichen mitgezählt und dann per InputStream das binäre Zeugs.

Binärdaten aus Textdatei extrahieren

mk666

Mitglied

mk666

Mitglied

Anime-Otaku

Erfahrenes Mitglied

zerix

Hausmeister

MeinerEiner_80

zerix

Hausmeister

mk666

Mitglied

Neue Beiträge