HTML-Parser benötigt !

AvS

Erfahrenes Mitglied
Hi Leute,

ich suche für ein Projekt einen guten HTML-Parser, der es mir ermöglicht, Reintext zwischen <p> - Tags zu extrahieren.
Habe schon mehrere ausprobiert, aber entweder war die API zu kompliziert oder es kam später nur Quatsch raus.
Hoffe hier kennt jemand etwas, womit man das möglich machen kann ! Vielen Dank im Voraus
 
Könnte der dann so funktionieren (habe gerade keine Zeit es zu testen) : "<p>\\.+</p>" ?
 
Naja, ganz banal ginge es so:

<p>(.*)</p>

Damit erhälst Du alle Zeichen zwischen den beiden p Tags. Natürlich gibt es da durchaus noch Optimierungsmöglichkeiten, aber dann müßte man schonmal eine Ahnung haben, was da an Zeichenfolgen auf einen warten.
 
Zurück