Page Source komplett auslesen

RedWing · 26. Juli 2005

Hallo gibt es eine Möglichkeit den Source einer Webseite komplett auszulesen?

Code:

document.getElementsByTagName("html")[0].innerHTML;

gibt mir ja nur alles was innerhalb des html tags steht ich hätte aber gern ALLES (einschließlich
doctype etc...).
Soll für den frefox bzw Mozillaengine sein.

Danke euch schonmal im vorraus für jede Antwort...

Gruß

RedWing

Sven Mintel · 26. Juli 2005

Ich wüsst da keine spezielle Methode.
Man könnte per XMLHttpRequest das aktuelle Dokument anfordern, ...der responseText würde dann den kompletten Code beinhalten. Ob das praktikabel ist, hängt davon ab, was du vorhast.

RedWing · 26. Juli 2005

Es geht darum den Page Source als String einer C++ xpcom Komponente zu übergeben,
welche dann via tidy diesen String parsen soll und auf xhtml Strict validieren soll, deshalb ist eben
die Angabe des Doctyps wichtig...
Werd das mal ausprobieren danke für deine Antwort.

Gruß

RedWing

Page Source komplett auslesen

RedWing

Erfahrenes Mitglied

Sven Mintel

Mitglied

RedWing

Erfahrenes Mitglied

Neue Beiträge