Hallo Leute,
ich versuche gerade alle möglichen URLs aus einer HTML Datei herauszufinden. Dabei wollte ich das ganze eigentlich mit RegExp machen. Aber irgendwie fehlt mir gerade so das letzte Stück vom Code. Ich habe bisher folgendes:
RegExp:
So, aber was mache ich nun damit? Ich will am Ende eine Liste mit allen URLs des HTML Dokuments haben.
http://de.php.net/manual/de/function.preg-grep.php
habe ich mir bereits angesehen, es scheint jedoch nicht das richtige zu sein. Und alle anderen RegExp Funktionen scheinen auch nicht ganz zu passen. Hat jemand einen Tipp für mich?
ich versuche gerade alle möglichen URLs aus einer HTML Datei herauszufinden. Dabei wollte ich das ganze eigentlich mit RegExp machen. Aber irgendwie fehlt mir gerade so das letzte Stück vom Code. Ich habe bisher folgendes:
RegExp:
Code:
http?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?
So, aber was mache ich nun damit? Ich will am Ende eine Liste mit allen URLs des HTML Dokuments haben.
http://de.php.net/manual/de/function.preg-grep.php
habe ich mir bereits angesehen, es scheint jedoch nicht das richtige zu sein. Und alle anderen RegExp Funktionen scheinen auch nicht ganz zu passen. Hat jemand einen Tipp für mich?