Guten Abend,
kennt sich von euch jemand mit wirklich guten und schnellen Algorithem aus, die es ermöglichen %-Wahrscheinlichkeit auszugeben. (Ich meine mich an einem Merge-Join erinnern zu können).
Eine kleine Problembeschreibung:
Es handelt sich um eine Webapplikation, die ca. 200 Datenbanktabellen und ca. 1 GB an Dokumenten in Archiven besitzt. Dieses besteht aus den verschiedensten MIME-Typen, beispielsweise PDF, Word, Excel,... (Bilder wollte ich nicht binär durchsuchen *G*).
Das Problem daran ist, dass ich sie nicht in der Datenbank habe, um die Inhalte zu durchsuchen. Ich halte es für untragbar jedes Dokument bei einer Suche zu öffnen und durchsuchen zu lassen.
Hatte von euch schon jemand ein solches Problem und könnte mir da einen Hinweis zur allg. Vorgehensweise geben?
Beste Grüße aus Gütersloh,
Claus
kennt sich von euch jemand mit wirklich guten und schnellen Algorithem aus, die es ermöglichen %-Wahrscheinlichkeit auszugeben. (Ich meine mich an einem Merge-Join erinnern zu können).
Eine kleine Problembeschreibung:
Es handelt sich um eine Webapplikation, die ca. 200 Datenbanktabellen und ca. 1 GB an Dokumenten in Archiven besitzt. Dieses besteht aus den verschiedensten MIME-Typen, beispielsweise PDF, Word, Excel,... (Bilder wollte ich nicht binär durchsuchen *G*).
Das Problem daran ist, dass ich sie nicht in der Datenbank habe, um die Inhalte zu durchsuchen. Ich halte es für untragbar jedes Dokument bei einer Suche zu öffnen und durchsuchen zu lassen.
Hatte von euch schon jemand ein solches Problem und könnte mir da einen Hinweis zur allg. Vorgehensweise geben?
Beste Grüße aus Gütersloh,
Claus