XML - PHP - Parser Problem

firespawn

Grünschnabel
Hallo,
also ich habe ein kleines XML Problem.

Ich habe nun einen XML Parser gebaut, der XML Dateien ausließt und entsprechende Inhalte ausgibt. Nun ist es so, dass ich einmal Beispiel-Dateien habe und Originaldatein. Bei den Beispiel-Dateien (klein ca. 200kb pro Datei) kann ich den Parser anwenden. Setze ich nun die Bezugsquelle auf die Originaldateien (ca. 30mb) dann bekomme ich folgenden Fehler

"XML error: Empty document at line 1"

Erste Zeile der XML Datei ist :
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>

ich habe keine Idee woran das liegen könnte.

------------------
Etwas was ich ausprobiert habe ist, wenn ich die XML Datei in WordPad lade und dann wieder abspeichere (Endung - XML) und wieder versuche diese zu parsen klappt das. Doch dann gibt es plötzlich Fehler, da jetzt umlaute falsch sind UND es kommt ab und zu vor das ein Zeichen ersetzt wird und dafür ein "Kästchen" steht.
------------------

Das Script ist in PHP geschrieben.

Hab ihr eine Idee ?

Vielen Dank
Fire
 
Der Fehler scheint dann wohl weniger an der größe der Datei zu liegen.

Vielleicht michst du irgendwo Charsets worauf die Umlaute hindeuten.
 
Hallo,
es wird doch aber sofort ein "Line 1" Fehler ausgeben ?!

Also ich verstehe nicht ganz den Grund hierfür ?

Vielen Dank
Fire
 
Was ich schonmal hatte war, dass PHP das zwischen <? und ?> als PHP-Befehl interpretiert hatte mit dem Erfolg, dass es mir auch ne Fehlermeldung ausgegeben hat.
 
Speicherst du das Dokument denn überhaupt mit der UTF-8-Zeichnkodierung, und weißt du überhaupt, was ein yes-Wert des standalone-Attributs bedeutet?
 
Hallo,
also ich verstehe dich nicht ganz @ con-f-use ?! Bitte näher erläutern.

Hallo Gumbo,
ich habe schon das Netz durchsucht doch keinen Erfolg gehabt. Was bedeutet denn das Standalone 'yes'.

Also ich lade das Dokument herrunter, dann entpacke ich es. Nun starte ich meinen Parser ohne irgendwelche besondernen Dinge also ohne dass ich definiere, dass das Dokument UTF-8 ist. Muss ich das tun ? Und wenn ja WIE ?

Vielen Dank
Fire
 
Besitzt in einem XML-Dokument das standalone-Attribut den Wert yes, bedeutet das, „dass es keine externen Markup-Deklarationen gibt, die die Informationen beeinflussen, die vom XML-Prozessor an die Anwendung weitergereicht werden.“ (Siehe XML Standalone-Dokumentdeklaration)

Wenn du angibst, dass das Dokument mit UTF-8-Kodierung zu behandeln ist, muss es auch mit UTF-8-Kodierung gespeichert sein.
 
Hallo - danke für deine Antwort.
Nun bin ich doch leider keinen Schritt weiter.
Ich verstehe einfach nicht wieso ich die Datei nicht einfach parsen kann. Selbst wenn ich den Code des Tutorials aus diesem Forum nehme und dann nur die Datei laden möchte erhalte ich diesen Fehler.

Mfg
Fire
 
Zurück