Bestimmte Daten von einer Homepage auslesen

Memfis

Erfahrenes Mitglied
Moin,

Mein Vorhaben ist eigentlich ganz einfach (von der Überlegung her), aber ziemlich schwierig in der Programmierung (besonders, wenn man es nicht kann)
Ich möchte von einer Homepage, wo ich keinen Zugriff auf die Datenbank habe gewisse Daten auslesen, z.B. Artikel von einem bestimmten Autor. Auf einer extra Page (also meiner) soll dann die Überschrift mit Link zum Artikel aufgelistet werden und wenn man auf den Link klickt direkt zum Artikel gelangen können.

Kann man da jemand helfen, ich habe absolut keine Ahnung, wie ich das hinbekommen soll, weil ich bislang nur auf meinem Server, bzw. Webspace hantiert habe und dort auch alles über MySQL regelte. Ein völlig neues Gebiet also.
 
Grundsätzlich gesehen, darfst du das nicht ohne Zustimmung des Betreibers der anderen Website und der Zustimmung des Authors des Artikels.

Wenn du die Zustimmung hast, kannst ihn ja fragen, ob er die Daten ohne Style bereitstellen kann, sei es als Feed, XML oder Plain-Text.

Ist für ihn nicht aufwendig, er kann es kontrollieren und ist !VIEL! einfacher, weil du nicht erst den ganzen Style "ausschalten" musst.
 
Geht um meine eigenen Artikel ;), die ich geschrieben habe und der Ordnung halber alle mal zentral sammeln und auflisten will.
 
Zuletzt bearbeitet:
Hallo!

Du hast keine Kopie deiner eigenen Daten? :eek:

Trotzdem bedarf es der Zustimmung des Seitenbetreibers, denn Du verursachst ihm damit Kosten.

Gruss Dr Dau
 
Naja, so schwierig ist das nicht. Du mußt lediglich das Format der HTML-Seite kennen, um die wichtigen Daten rauszufiltern. Also HTML-Code einlesen, Tags entfernen und die betreffenden Daten in einer besseren Form ablegen.
Nennt sich "Screen Scraping" und Suchmaschinen helfen dir gerne weiter:)
 
Zurück