Internet suche in c++

Der_Unbekante

Grünschnabel
Hallo,

Ich habe volgendes Problem und zwar möchte ich ein Programm Programmieren das das Netz durchsucht. Nach bestimmten begriffen und so.

Also wenn ich dateien auf´m server habe möchte ich auf sie zugreifen können sie durchsuchen und die ergebnisse ausgeben.

Ich Programiere mit Borland, Habe da auch schon viele Elemente gesehen womit ich auf das Netz zugreifen kann. Aber ich habe es noch nicht hin gekriegt sie zu konfiegurieren.

Könnte mir jemand da helfen?

Das Problem ist das ich die dateien nur dirch http://... erreichen kann und sonst nicht.

Hat jemand damit schon erfahrungen gemacht?

Vieleicht ein beispiels Programm oder so?


Bedanke mich im voraus!
 
Na das ist mal wieder eine super Problembeschreibung, von der Rechtschreibung mal ganz zu schweigen.

Also du willst ein Programm schreiben mit dem du dass Internet durchsuchen kannst? Oder das LAN? Und nach was? Dateien? Inhalten? Und das willst du dann öffnen?

Bitte formuliere deine Frage etwas genauer und achte auf die Rechtschreibung.

Greetz...
Sinac
 
Tut mir Leid wegen der Rechtschreibung. Hatte schon immer Probleme damit.
So ich muss eine Intranet Seite durchsuchen.

Die Dateien sind meist .doc oder auch .txt und pdf Dateien. Diese Datei inhalte müssen nach einem Suchbegriff durchsucht werden. Denn ich eingeben kann.
So mit Lokal aufm Rechner habe ich das schon gemacht.
Aber wie kann ich es im Intranet machen so dass es einen Server durchsucht. diese Dateien sind nur durch den normalen http://... Pfad erreichbar.

hoffe es ist jetzt besser verständlich.
 
Zuletzt bearbeitet:
Puh, ich glaube das ist garnicht so einfach - Dateifreigaben im Netzwerk laufen unter Windows ja über das SMB Protokoll. Eventuell kannst du die Windowssuche in dein Programm einbinden um so an die Dateien zu kommen. Dann müsstest du sie so wie lokale Dateien verarbeiten können, dass regelt Windows mit SMB für dich.
 
Wenn du nur Zugriff per http hast, musst du die einzelnen Webseiten analysieren und den Links auf der jeweiligen Seite folgen. Sozuagen musst du einen Webcrawler programmieren.

Machs am besten so, lade die jeweils aufgerufende Seite in einen Buffer. Analysiere die A-Tags vom HTML-Code. Sollte dort eine der gewünschten Dateien verlinkt sein, läds du diese einfach runter und durchsuchst Sie Lokal nach den gewünschten Begriffen.

Die A-Tags die zu einer anderen Unter-Seite führen, musst du dann sozusagen auch öffnen und analysieren. Solang bist das ganze Intranet durchsucht wurde.

Links die nicht zum Intranets gehören, darfst du natürlich nicht folgen.
 
Zurück