MS Word Files lesen?

fastfiler

Mitglied
hi,

wie es der titel schon sagt möchte ich MS word files (*.doc) lesen bzw. den text extrahieren. ich hab zwar schon das Jakarta POI projekt mit dem modul HWPF gefunden, aber als ich mir die api angeschaut habe, jedoch ist diese lib noch im beta stadium und bietet nicht die methoden die ich erwartet habe. hat zufällig jmd von euch schon sowas ähnliches gemacht und kann mir nen lib nennen die funktioniert oder weiss eine andere lösung?

mfg & thx

fasti
 
Hallo!

Hmmmm, du hast recht Apache POI HWPF hat derzeit keinen Hauptentwickler mehr...
wie waers denn, wenn du das Word-Doc mit irgendeinem Tool nach PostScript oder PDF konvertierst und dann mit einer entsprechenden Java Bibliothek wie beispielsweise iText darauf zugreifst?

Gruss Tom
 
Hallo. Ich bin zur Zeit auch auf der Suche nach einer Möglichkeit, wie ich ein Doc-Template bearbeiten kann. Hat sich im Bereich POI schon etwas getan? Mit googlen laufe ich da ins Leere :(.

Gruß
Hardie
 
Zurück