PDF mit PHP auslesen

crsakawolf

Erfahrenes Mitglied
Morgen Morgen!

Eine Frage, ich beabsichtige in meine Suchfunktion das auslesen von PDF's einzubauen.

Meine Frage hierzu, geht es allein mit PHP?
Leider habe ich dazu noch keine Funktion gefunden :/

Habe nur etwas über PDFtoText und dann halt aus dem Text auslesen.
Aber da bin ich auch noch nicht fündig geworden, zumindest nicht das richtige Programm welches mit Parametern angesprochen werden kann.

Ist es denn vlt Sogar mögl mit Acrobat Prof dies zu realisieren üebr PHP?
Das würde mir zumindest zur Verfügung stehen.

Beste Grüße

cRs
 
wow da hast du dir viel vorgenommen.....
Also ich kenne keine Funktion der php pdf library die das lösen würde. Was eigenes Schreiben ist auch nicht einfach. Acrobat Professional hilft dir auch nix denn das müsste ja auf dem Server liegen und eine php/html ausgabe besitzen.
Das einzige wäre die PDF als Text auslesen mit PDFtoText und dieses dokument untersuchen.
Oder du schreibst ein java Programm auf dem Server aber dazu musst du dann die PDF Filesyntax kennen.....
Könnte sehr kompliziert werden dein Projekt :D
 
Hoi again,

also ich habs jetzt mit XPDF probiert.
Das wandelt die PDF zumindest schonma in TXT um.

leider nur noch nicht auf dem Webserver, da kommt noch FM "Unable to fork"
Hab aber schon mit m Admin gesprochen, werden dann mal die cmd.exe in den Ordner schmeisen, vlt klappts dann.

Prinzipiell habe ichs mir so gedacht, das ich das Script in der Nacht per Cj laufen lasse,
d.h. dayli updates der TXT dateien und wenn die TXT dann durchsucht werden und es eine passende pdf dazu gibt, dann wird halt die PDF verlinkt ^^
 
Argh ...
simpel aber ich kanns nicht -.-

findet jmd den fehler warum er immer nen fehler ausgibt und es nicht ausführ?

PHP:
<?
if(!system("C:\\suche\\pdftotxt\\pdftotext.exe Telefonverzeichnis.pdf",$ausgabe))
                                                                echo "fehler";
print_r($ausgabe);
echo $ausgabe;
?>

Achja das ist die Fehlermeldung
"CGI-Fehler
Die angegebene CGI-Anwendung hat keinen vollständigen Satz von HTTP-Headern zurückgegeben."
 
Zuletzt bearbeitet:
Zurück