Auslesen einer HTM-Datei in ein TXT File

MatMagic

Erfahrenes Mitglied
Hallo Leute !
Ich habe folgendes Problem:
Ich möchte eine HTM Datei in eine TXT Datei schreiben.
Allerdings nicht die komplette Datei mit dem HTM Code - sondern nur das was im Internet-Explorer dargestellt wird.

Bsp.:
Die HTM Datei sieht so aus:
<html>
<head>
<title>Test-Htm</title>
</head>
<body bgcolor="#FFFFFF">
<p>Ausgabe 1<br>
Ausgabe 2<br>
Ausgabe 3</p>
</body>
</html>

Die TXT Datei sollte dann so aussehen:
Ausgabe 1
Ausgabe 2
Ausgabe 3

Das ganze soll nicht online funktionieren (wäre aber auch o.k.) es reicht völlig wenn ihr einen offline Lösungsansatz für mich habt.

Ich hoffe euch fällt was ein. ;)
 
Zuletzt bearbeitet:
Hallo MatMagic,

eine Möglichkeit wäre es, den HTML-Quelltext mit den üblichen Stringbearbeitungs-Funktionen nach speziellen Tags zu durchsuchen und deren Inhalt dann herauszufiltern.
Eine andere Möglichkeit wäre es, eine XML-Bibliothek aus dem Internet herunterzuladen und diese zu verwenden, um die einzelnen Elemente des HTML-Dokumentes zu durchsuchen.
Beide Möglichkeiten bringen allerdings einige Probleme mit sich, so ist die erste Möglichkeit unter Umständen relativ rechenintensiv und die zweite erfordert eine in puncto "wohlgeformtes XML" (Achtung: Suchbegriff!) ein vollständiges Dokument, wenn keine ungewünschten Laufzeitfehler auftreten sollen.

Ansonsten ist dein Vorhaben noch aus einer anderen Sicht problematisch, denn nicht alle Tags, die im Browser etwas anzeigen, lassen sich so einfach in eine Textdatei übernehmen.
 
:( Danke für die Antwort
Das würde mein kleines Projekt sprengen.....ich dachte es gäbe da eine sehr einfache Methode die ich nicht kenne.
Das auslesen des Strings ist mir bei dem Quelltext leider viel zu umständlich und auch zu langwierig.
Mit XML kenne ich mich null aus.

Aber danke für die Antwort. :)
 
Zurück