Page Source komplett auslesen

RedWing

Erfahrenes Mitglied
Hallo gibt es eine Möglichkeit den Source einer Webseite komplett auszulesen?
Code:
document.getElementsByTagName("html")[0].innerHTML;

gibt mir ja nur alles was innerhalb des html tags steht ich hätte aber gern ALLES (einschließlich
doctype etc...).
Soll für den frefox bzw Mozillaengine sein.

Danke euch schonmal im vorraus für jede Antwort...

Gruß

RedWing
 
Ich wüsst da keine spezielle Methode.
Man könnte per XMLHttpRequest das aktuelle Dokument anfordern, ...der responseText würde dann den kompletten Code beinhalten. Ob das praktikabel ist, hängt davon ab, was du vorhast.
 
Es geht darum den Page Source als String einer C++ xpcom Komponente zu übergeben,
welche dann via tidy diesen String parsen soll und auf xhtml Strict validieren soll, deshalb ist eben
die Angabe des Doctyps wichtig...
Werd das mal ausprobieren danke für deine Antwort.

Gruß

RedWing
 

Neue Beiträge

Zurück