Kahmoon
Erfahrenes Mitglied
Tach beisammen,
meiner einer hat mal wieder ein Problemchen. Ich muss bestehende Daten (350.000 Artikel *heul*) eines älteren CMS Systems für das neue aufbereiten. Eigentlich kein Problem die Daten aus der zu holen....nur werden im Artikeltext selbst CMS interne Befehle verwendet. Diese müssen jetzt gefiltert werden.
Ich weiß wie man bei Regulären Ausdrücken Passagen ersetzt. Aber ich bräuchte den Bereich zwischen den gesuchten Passagen.
Ein Datensatz sieht wie folgt aus:
So wie ich das sehe sind sämtliche Inhalte wie folgt aufgebaut. Die Zahlen nach s variieren.
Wie bekomme ich denn hier jetzt blahtext extrahiert? Gibts hier etwas ähnliches wie bei ModRewrite, wo man bestimmte Bereiche als Variable wieder ausgeben kann?
z.B.
Wäre dankbar für Lösungsansätze von RegExp Profis
Gruß
meiner einer hat mal wieder ein Problemchen. Ich muss bestehende Daten (350.000 Artikel *heul*) eines älteren CMS Systems für das neue aufbereiten. Eigentlich kein Problem die Daten aus der zu holen....nur werden im Artikeltext selbst CMS interne Befehle verwendet. Diese müssen jetzt gefiltert werden.
Ich weiß wie man bei Regulären Ausdrücken Passagen ersetzt. Aber ich bräuchte den Bereich zwischen den gesuchten Passagen.
Ein Datensatz sieht wie folgt aus:
Code:
a:12:{s:12:"ar_discuslmt";s:0:"";s:13:"ar_stichzeile";s:11:"Traunstein ";s:13:"ar_unterzeile";s:0:"";s:14:"ar_superscript";s:0:"";s:7:"ar_head";s:0:"";s:12:"ar_subscript";s:0:"";s:11:"ar_leadtext";s:0:"";s:9:"ar_author";s:0:"";s:11:"ar_location";s:0:"";s:13:"ar_multilinks";s:0:"";s:7:"ar_text";s:528:"<p>Nach den bisherigen Ermittlungen der Polizei deutet alles auf einen Selbstmord hin. Familienangehörige hatten den 54-Jährigen am Nachmittag tot im Keller seines Anwesens in Traunstein gefunden. </p>
<p>In Polizeikreisen hieß es, Arsan habe sich erhängt. Über die Motive des Selbstmordes lagen der Polizei zunächst keine Erkenntnisse vor. Arsan war in der Stichwahl am 16. März mit knapp 67 Prozent zum neuen Rathauschef von Traunstein gewählt worden. Er hätte sein Amt am 1. Mai antreten sollen.</p>
<p><em>dpa/lby</em></p>";s:12:"ar_wordcount";i:74;}
Code:
s:12:"ar_text";s:0:"blahtext";
z.B.
PHP:
$suche = '/s:\d{1,}:"ar_text";s:\d{1,}:"";/';
Wäre dankbar für Lösungsansätze von RegExp Profis
Gruß
Zuletzt bearbeitet: