Seitenzahl eines PDF und Word Dokumentes mit PHP auslesen

iMaci1

Grünschnabel
Hat jemand eine Idee wie ich die Seitenzahlen eines PDF und Word Dokumentes heraus bekomme ?
Die PDF oder die Word Datei wird vom User auf den Server geladen und dann als FAX-Anhang versendet. Jetzt werden die Kosten dafür pro Seite abgerechnet, jetzt will ih aber nicht her gehen und jedes Dokument öffnen.

Irgendwie muss es doch eine Möglichkeit geben, die Meta Daten zu lesen.

Ich bin absolut planlos
 
Also mir fällt nur für die Word - Dateien ne ziemlich komplizierte Lösung ein, dafür müsste aber Word auf dem Server installiert sein, was ohnehin schon etwas fragwürdig ist. Dann schreibst du dir ein VBA - Skript, welches beim Öffnen einer bestimmten Word - Datei gestartet wird (bspw. vba.doc) und dem du gleich per Parameter die zu analysierende Word Datei mitgeben kannst. Dann checkt das VBA - Skript die Seiten deines Word Dokuments, gibt sie weiter (wohin auch immer du willst) und schließt das ganze wieder.

Wie gesagt, nicht schön, unpraktisch, aber vielleicht ne Teillösung ;)
 
Sofern deine Word-Dateien in der Kopfleiste, die Seitenzahl oder noch besser die GesamtSeiten-Anzahl stehen haben, kannst du deine Word-Dateien mit PHP wie eine normale txt-Datei einlesen und nach diesem Eintrag suchen:
 NUMPAGES 13
Dabei steht NUMPAGES für die Gesamtseiten-Anzahl und 13 ist die gewünschte Zahl.

Für pdf weiß ich jetzt momentan nichts
 
PDF als Stream öffnen, nach "/Type /Pages" und *dannach* nach "/Count" suchen. Die Zahl hinter dem letztgenannten String beinhaltet Deine Seitenanzahl.
 
Dankeschön erst einmal für eure Ideen.

Zum Thema Word-Dateien:
leider kann ich die Word Dateien nicht beeinflussen, da die von verschiedenen Usern geschrieben und hochgeladen werden.Somit funktioniert die Lösung mit nach NUMPAGES
suchen leider nicht.


Das mit Word auf dem Server ist mir zu kompliziert, für das was ich benötige.


Zum Thema PDF-Dateien:
Mit dem Stream habe ich auch schon versucht. Aber leider kommt das immer darauf an, mit welchem Programm die PDF Datei erstellt wurde. Habe es mit verschiedenen Dateien Probiert und nur bei jeder 3. steht irgendwo im Stream Pages und somit ist das auch etwas unzuverlässig.


Habe es jetzt erst einmal so gelöst, daß ich bei meinem Fax-Provider mir die Daten hole, nach dem dieser das Fax versendet hat.
Ist zwar nicht ganz so glücklich, aber für den Anfang reicht es erst einmal.

Wenn allerdings irgend jemand eine doch eine Möglichkeit kennt, mit der ich direkt aus dem Dokument die Seitenzahl heraus lesen kann wäre ich sehr dankbar.

Eine Idee wäre noch, das mit dem Programm fpdtk zu machen. Allerdings habe ich davon gar keine Ahnung.
 
Zurück