preg_match wie filtern?

hehe_me

Mitglied
hi,

ich habe probleme den fett markierten Text mit preg_match zu erhalten... ich habe ehrlich gesagt keine ahnung wie der pattern bzw. subpattern auszusehen hat....

könnte mir jmd hierzu eine hilfestellung geben?

den Text will ich...

Bei Bayerns Champions-League-Gegner Florenz findet der gestrauchelte Stürmerstar Gilardino zurück zum Glück: Unter Cesare Prandelli, der ihn schon in Parma zu einem der besten Stürmer Italiens gemacht hatte, blüht er nach seinen Schwierigkeiten mit den Niederungen des Alltags wieder auf.

aus diesem html code...

HTML:
	<div style="clear: left;">
	<img style="float: left; padding-right: 5px;" src="http://www.faz.net/m/%7BA8BFB9E0-FAC0-4C22-9CD9-72063C93A761%7DFile2.jpg" border="0" width="111" height="139">
	Bei Bayerns Champions-League-Gegner Florenz findet der gestrauchelte Stürmerstar Gilardino zurück zum Glück: Unter Cesare Prandelli, der ihn schon in Parma zu einem der besten Stürmer Italiens gemacht hatte, blüht er nach seinen Schwierigkeiten mit den Niederungen des Alltags wieder auf.
	<div style="border-top: 1px solid rgb(122, 137, 204); margin: 5px 0pt; font-family: arial; font-style: normal; font-variant: normal; font-weight: normal; font-size: 10px; line-height: normal; font-size-adjust: none; font-stretch: normal; -x-system-font: none; color: rgb(122, 137, 204); clear: both;">
 
Mit folgendem regulären Ausdruck sollte es funktionieren:
Code:
/<div style="clear: left;">\s*<img(?:\s+[a-z\-]+\s*="[^">]*")*\s*>([^<]+)/
Einfacher wäre es aber den dazugehörigen RSS Feed zu verarbeiten.


Ich hoffe allerdings, du willst das nur privat nutzen oder hast dir eine Erlaubnis geholt:
http://www.faz.net/s/Rub8B298A3529D148029248B045249C1C1E/Doc~E573EEC41015C4EC096B0B7778A9518C3~ATpl~Ecommon~Scontent.html hat gesagt.:
Die Inhalte dürfen von den Nutzern nur für eigene persönliche Zwecke verwendet werden. Die Weitergabe von Portal-Inhalten an Dritte (auch auszugsweise) ist ohne unsere Zustimmung nicht gestattet. […] Des Weiteren ist es untersagt, Daten aus dem Portal mittels technischer Hilfsmittel (bspw. Crawler, Spider etc.) zu kopieren.
 
hi gumbo,

danke ich werde es mal testen..

1. ich benutze schon das rss feed... nur kommt man nicht auf den bloßen text...
2. ja es soll nur zu test und demonstrationszwecken dienen.. das der text aus der faz stammt werde ich so oder so hinschreiben... nur will ich keine zwangslinks... wobei wie gesagt das nur als testzweck herhalten muss...

wie gesagt vielen dank ich werds ausprobieren...
 
irgendwie scheint er den text nicht zu erkennen

ich habe die " mit \" ersetzt verständlicherweise...

erkennen tut er leider nichts... woran könnte es liegen?
 
Wenn du wirklich nur den Text brauchst, kannst du auch einfach sämtliche Tags mittels strip_tags() entfernen.
 
ok danke....

gibt es eine funktion womit ich einen text ab einem suchstring löschen kann....?

ich erhalte z.b. durch strip_tags.. folgendes:

HTML:
Der Frankfurter Renn-Klub hat einen Insolvenzantrag gestellt. Dies teilte Klubpräsident Günter Paul mit. Dem Verein fehlen 300.000 Euro, um seinen laufenden Betrieb aufrechtzuerhalten. FAZ.NET - Homepage | Politik | Gesellschaft | Wirtschaft | Finanzmarkt | Sport | Feuilleton | Reise | Wissen | Auto | Computer

ich würde einschlielich FAZ.NET den rest text löschen... gibt es da auc heine schöne funktion?
 
Hier könntest du wieder mit einem regulären Ausdruck arbeiten:
PHP:
preg_replace('/ FAZ\.NET - .*/', '', $str)
 
hi

danke aber bei deinem letztgenannten code erhalte ich immer diese fehlermeldung

Parse error: syntax error, unexpected T_ECHO


mein code:

Code:
$string2 = preg_replace('/ FAZ\.NET - .*/', '', $mytemp1)

wo liegt der fehler? :confused:
 
Zuletzt bearbeitet:
Zurück