Hi zusammen...
Ich beiß mir jetzt schon ne zeit lang die Zähne an dem Problem aus, aber ich weiß nicht weiter... Hab schon diverse Foren durchsucht aber finde leider keine Antwort...
Ich möchte eine HTML-Datei über eine URL aufrufen und dann dort z.B. nur die Inhalte bestimmter Tags, wie zum Beispiel Tabellen-Inhalte auslesen.
Das Aufrufen der HTML funktioniert. Mit einem Iterator springe ich zu den relevanten Tags (z.B. TD). Ich kann zwar auf die Tag-Attribute zugreifen, aber ich weiß nicht wie ich die Inhalte (also den Bereich zwischen z.B. <TD> und </TD>) nach dem Iterator auslesen kann...
Hier mal mein bisheriger Code:
Wär für Eure Hilfe sehr dankbar...
Vielen Dank!
Nicole
Ich beiß mir jetzt schon ne zeit lang die Zähne an dem Problem aus, aber ich weiß nicht weiter... Hab schon diverse Foren durchsucht aber finde leider keine Antwort...
Ich möchte eine HTML-Datei über eine URL aufrufen und dann dort z.B. nur die Inhalte bestimmter Tags, wie zum Beispiel Tabellen-Inhalte auslesen.
Das Aufrufen der HTML funktioniert. Mit einem Iterator springe ich zu den relevanten Tags (z.B. TD). Ich kann zwar auf die Tag-Attribute zugreifen, aber ich weiß nicht wie ich die Inhalte (also den Bereich zwischen z.B. <TD> und </TD>) nach dem Iterator auslesen kann...
Hier mal mein bisheriger Code:
Code:
public class AmazonFavList {
public static void main(String[] args) throws Exception {
URL url = new URL("http://www.amazon.de/quot-design-quot/lm/RZIQFD0IQ5KPV"); //nur eine Beispiel-URL
URLConnection connection = url.openConnection();
BufferedReader buffer = new BufferedReader(new InputStreamReader(connection.getInputStream()));
HTMLEditorKit editorKit = new HTMLEditorKit();
HTMLDocument htmlDoc = new HTMLDocument();
htmlDoc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
editorKit.read(buffer, htmlDoc, 0);
HTMLDocument.Iterator iter = htmlDoc.getIterator(HTML.Tag.TD);
// hier würde ich jetzt gerne auf den Inhalt zugreifen....
Wär für Eure Hilfe sehr dankbar...
Vielen Dank!
Nicole