preg_match wie filtern?

hehe_me · 22. Oktober 2008

hi,

ich habe probleme den fett markierten Text mit preg_match zu erhalten... ich habe ehrlich gesagt keine ahnung wie der pattern bzw. subpattern auszusehen hat....

könnte mir jmd hierzu eine hilfestellung geben?

den Text will ich...

Bei Bayerns Champions-League-Gegner Florenz findet der gestrauchelte Stürmerstar Gilardino zurück zum Glück: Unter Cesare Prandelli, der ihn schon in Parma zu einem der besten Stürmer Italiens gemacht hatte, blüht er nach seinen Schwierigkeiten mit den Niederungen des Alltags wieder auf.

aus diesem html code...

HTML:

	<div style="clear: left;">
	<img style="float: left; padding-right: 5px;" src="http://www.faz.net/m/%7BA8BFB9E0-FAC0-4C22-9CD9-72063C93A761%7DFile2.jpg" border="0" width="111" height="139">
	Bei Bayerns Champions-League-Gegner Florenz findet der gestrauchelte Stürmerstar Gilardino zurück zum Glück: Unter Cesare Prandelli, der ihn schon in Parma zu einem der besten Stürmer Italiens gemacht hatte, blüht er nach seinen Schwierigkeiten mit den Niederungen des Alltags wieder auf.
	<div style="border-top: 1px solid rgb(122, 137, 204); margin: 5px 0pt; font-family: arial; font-style: normal; font-variant: normal; font-weight: normal; font-size: 10px; line-height: normal; font-size-adjust: none; font-stretch: normal; -x-system-font: none; color: rgb(122, 137, 204); clear: both;">

Gumbo · 22. Oktober 2008

Mit folgendem regulären Ausdruck sollte es funktionieren:

Code:

/<div style="clear: left;">\s*<img(?:\s+[a-z\-]+\s*="[^">]*")*\s*>([^<]+)/

Einfacher wäre es aber den dazugehörigen RSS Feed zu verarbeiten.

Ich hoffe allerdings, du willst das nur privat nutzen oder hast dir eine Erlaubnis geholt:

http://www.faz.net/s/Rub8B298A3529D148029248B045249C1C1E/Doc~E573EEC41015C4EC096B0B7778A9518C3~ATpl~Ecommon~Scontent.html hat gesagt.:
Die Inhalte dürfen von den Nutzern nur für eigene persönliche Zwecke verwendet werden. Die Weitergabe von Portal-Inhalten an Dritte (auch auszugsweise) ist ohne unsere Zustimmung nicht gestattet. […] Des Weiteren ist es untersagt, Daten aus dem Portal mittels technischer Hilfsmittel (bspw. Crawler, Spider etc.) zu kopieren.

hehe_me · 22. Oktober 2008

hi gumbo,

danke ich werde es mal testen..

1. ich benutze schon das rss feed... nur kommt man nicht auf den bloßen text...
2. ja es soll nur zu test und demonstrationszwecken dienen.. das der text aus der faz stammt werde ich so oder so hinschreiben... nur will ich keine zwangslinks... wobei wie gesagt das nur als testzweck herhalten muss...

wie gesagt vielen dank ich werds ausprobieren...

hehe_me · 22. Oktober 2008

irgendwie scheint er den text nicht zu erkennen

ich habe die " mit \" ersetzt verständlicherweise...

erkennen tut er leider nichts... woran könnte es liegen?

Gumbo · 22. Oktober 2008

Wenn du wirklich nur den Text brauchst, kannst du auch einfach sämtliche Tags mittels strip_tags() entfernen.

hehe_me · 22. Oktober 2008

ok danke....

gibt es eine funktion womit ich einen text ab einem suchstring löschen kann....?

ich erhalte z.b. durch strip_tags.. folgendes:

HTML:

Der Frankfurter Renn-Klub hat einen Insolvenzantrag gestellt. Dies teilte Klubpräsident Günter Paul mit. Dem Verein fehlen 300.000 Euro, um seinen laufenden Betrieb aufrechtzuerhalten. FAZ.NET - Homepage | Politik | Gesellschaft | Wirtschaft | Finanzmarkt | Sport | Feuilleton | Reise | Wissen | Auto | Computer

ich würde einschlielich FAZ.NET den rest text löschen... gibt es da auc heine schöne funktion?

Gumbo · 22. Oktober 2008

Hier könntest du wieder mit einem regulären Ausdruck arbeiten:

PHP:

preg_replace('/ FAZ\.NET - .*/', '', $str)

hehe_me · 22. Oktober 2008

hi

danke aber bei deinem letztgenannten code erhalte ich immer diese fehlermeldung

Parse error: syntax error, unexpected T_ECHO

mein code:

Code:

$string2 = preg_replace('/ FAZ\.NET - .*/', '', $mytemp1)

wo liegt der fehler?

Gumbo · 22. Oktober 2008

Vermutlich das Semikolon.

preg_match wie filtern?

hehe_me

Mitglied

Gumbo

Erfahrenes Mitglied

hehe_me

Mitglied

hehe_me

Mitglied

Gumbo

Erfahrenes Mitglied

hehe_me

Mitglied

Gumbo

Erfahrenes Mitglied

hehe_me

Mitglied

Gumbo

Erfahrenes Mitglied

Neue Beiträge