Dateiinhalte durchsuchen

qsrs

Erfahrenes Mitglied
Hallo,

mich interessiert ein Lösungsansatz, um mit PHP Inhalte von Dateien (doc, xls, txt, pdf etc.) zu durchsuchen. Also nehmen wir an, auf einem Server befinden sich einige hunderte oder tausende Dateien, und ich möchte nun in einer Html-Suchmaske mittels Browser einen Suchbegriff eingeben, und nach diesem soll innerhalb aller Dateien gesucht werden. Ich vermute eine Schleife mit fopen würde einfach zu lange dauern. Was meint ihr?

Oder gibt es hier schon Projekte, Klassen bwz. Lösungsansätze?

Wäre eine Möglichkeit, beim Upload die Inhalte der Dateien zusätzlich in eine DB zu schreiben, um dann besser suchen zu können? Und falls ja, wie könnte so etwas ungefähr aussehen?

Vielen Dank für die Antworten.
 
Zuletzt bearbeitet:
Ich würde auf jedenfall die Dateien indizieren und in der Datenbank speichern. Jedesmal wenn jemand sucht, die Dateien öffnen, auslesen und wieder schließen sollte die Resourcen sprengen.
 
Ich würde auf jedenfall die Dateien indizieren und in der Datenbank speichern. Jedesmal wenn jemand sucht, die Dateien öffnen, auslesen und wieder schließen sollte die Resourcen sprengen.

Ok, jedoch wird das denke ich nicht funktionieren, wenn ich wie von tombe "file_get_contents" verwende, und diesen Inhalt dann in die DB schreibe. Wenn ich damit eine Word-Datei auslese, bekomme ich ja keine Textinhalte, das ist ja kodiert. Geht das überhaupt?
 
Genau das ist das Problem das du hast.
Ich gebe zu das ich die ursprüngliche Frage was die Dateitypen angeht nicht richtig gelesen habe und somit ist meine obige Antwort eigentlich nutzlos.

Zumindest was die Geschwindigkeit der Suche angeht muss ich CookieBuster absolut recht geben. Die Frage ist halt wie du Word, PDF und Excel in eine Datenbank bekommst. Reicht es denn nicht aus wenn du beim Upload ein oder mehrere Eingabefelder zur Vefügung stellst wo man bestimmte Begriffe eingeben kann die für diese Datei relevant sind.

Dann speicherst du diese Angaben zusammen mit dem Dateinamen in der DB ab und kannst beim Suchen auf diese Daten zugreifen.

Wobei für Excel scheint es eine Möglichkeit zu geben (habe nicht alles gelesen): http://blog.t-error.ch/article/564/excel_dateien_mit_dem_php-excelreader_lesen/
 
Zuletzt bearbeitet:
Zurück