Erfahrungen mit Suchalgorithmen für komplexe Webanwendungen teils in DB, teils im FS

Vaio82

Erfahrenes Mitglied
Guten Abend,

kennt sich von euch jemand mit wirklich guten und schnellen Algorithem aus, die es ermöglichen %-Wahrscheinlichkeit auszugeben. (Ich meine mich an einem Merge-Join erinnern zu können).

Eine kleine Problembeschreibung:

Es handelt sich um eine Webapplikation, die ca. 200 Datenbanktabellen und ca. 1 GB an Dokumenten in Archiven besitzt. Dieses besteht aus den verschiedensten MIME-Typen, beispielsweise PDF, Word, Excel,... (Bilder wollte ich nicht binär durchsuchen *G*).

Das Problem daran ist, dass ich sie nicht in der Datenbank habe, um die Inhalte zu durchsuchen. Ich halte es für untragbar jedes Dokument bei einer Suche zu öffnen und durchsuchen zu lassen.

Hatte von euch schon jemand ein solches Problem und könnte mir da einen Hinweis zur allg. Vorgehensweise geben?


Beste Grüße aus Gütersloh,
Claus
 
Oehm kannst du nicht nach Datei Erweiterung gehen?
Sicher bei den Tabellen ist das nicht das wahre ,aber bei dem Rest..

BTW:
Was willst du mit dem Wahrschlichkeitszeug, ist das nicht zu ungenau um damit die Daten zu bestimmen.
 
Wie meinst Du das mit den Erweiterungen? Ich kann Dir da gerade leider nicht ganz folgen. Bitte um Erläuterung... : - )

Die Wahrscheinlichkeit soll dazu dienen, trotz Rechtschreibfehler dennoch passende Resultate zu erziehlen.


/* Es handelt sich dabei um eine Volltextsuche durch alle vorhandenen Daten, in sämtlichen Sprachen... */
 
Zuletzt bearbeitet:
Zurück