newsseiten anzapfen

polar

Mitglied
suche noch ein paar hints wie ich mit php news seiten anzapfe um z.b. die headlines auszugeben. bin vor kurzem mal über einen entsprechenden artikel gestolpert, habe den link allerdings nicht mehr :( kann mir jemand aushelfen? danke schonmal!
 
Das kommt ganz darauf an, um welche News-Site es sich jeweils handelt.

Wenn's blöd kommt, musst du wirklich die gesamte Seite per file() ziehen und nach den Headlines parsen (anhand von bestimmten Tags oder Formatierungen).

Manche Sites (heise, golem...) bieten aber zum Glück extra für solche Fälle rdf-Files an. Da stehen im Prinzip die Headlines und die dazugehörigen Links in einem XML-konformen Format drin. Die sind viel bequemer und problemloser zu parsen :) (hab letztens nen rdf-Parser in PHP geschrieben, kann ich ja mal posten, wenn Interesse besteht...)


HTH
reima
 
Na ja, für ein Tutorial wär's etwas dürftig, hab das nur mal so schnell in 5 Minuten zusammengekloppt ;)

Aber ich könnt's eventuell ausbauen und ein XML-Parsing tut machen ;)


Hier also der Code:
PHP:
<?
$data = join("", file("http://www.heise.de/newsticker/heise.rdf"));

preg_match_all("/<item>(.+)<\/item>/sU", $data, $items);

foreach ($items[1] as $item) {
 preg_match("/<title>(.+)<\/title>/U", $item, $title);
 preg_match("/<link>(.+)<\/link>/U", $item, $link);
 // $title[1]: Headline
 // $link[1]: zugehöriger Link 
 echo "<a href=\"$link[1]\">$title[1]</a><br>";
}
?>
 
Wäre vielleicht doch nicht so schlecht, dass ganze mal als Tutorial zu posten (evtl. mit den neuen Erweiterungen) ...
 
also wenn ich das ausführe bekomm ich zwei error lines...

Warning: Unknown modifier 't' in xxx
Warning: Invalid argument supplied for foreach() in xxx
 
Zurück