N'Abend Jungs und Mädels..
Sitz grad an einem kleineren Projekt und das Euro-Symbol ist schon ne kleine Welt für sich.
Wenn ich Regex darauf loslasse, komme ich nicht umhin, mehrere Möglichkeiten dafür anzugeben:
Irgendwas vergessen?
Nun, jetzt möchte ich eine weitere Seite (mit Einverständnis des Besitzers) crawlen und die Seite scheint grundsätzlich eine falsche Kodierung anzugeben (sieht Jemand woran es liegt? und welche nun ausgeworfen wird?) Das Validator-Addon zeigt ein Fragezeichen. In php landet bei Sonderzeichen nur Mist, zB ist das Eurosymbol nun
Die Umlaute nicht minder kaputt.
Jemand ne Idee, woran es liegt?
Muss ich in php die Textkodierung umstellen?
Kann ich dem Webadmin irgend nen Tip geben?
Weitere Infos:
Im Validator wird folgender Fehler gezeigt :
p.s.:
Hm.. Aha, es gibt also noch Unicode Derivate wie zB UTF-8 Hexadezimal, dort ist das Euro-Symbol nämlich 0xE2 0x82 0xAC (was meinem strangeEuro entspricht) Wie gehe ich gegen so etwas vor?
mfg chmee
Sitz grad an einem kleineren Projekt und das Euro-Symbol ist schon ne kleine Welt für sich.
Wenn ich Regex darauf loslasse, komme ich nicht umhin, mehrere Möglichkeiten dafür anzugeben:
Code:
\x80
€
€
€
€
& # 8 3 6 4 ;
Irgendwas vergessen?
Nun, jetzt möchte ich eine weitere Seite (mit Einverständnis des Besitzers) crawlen und die Seite scheint grundsätzlich eine falsche Kodierung anzugeben (sieht Jemand woran es liegt? und welche nun ausgeworfen wird?) Das Validator-Addon zeigt ein Fragezeichen. In php landet bei Sonderzeichen nur Mist, zB ist das Eurosymbol nun
PHP:
$strangeEuro=chr(226).chr(130).chr(172);
Die Umlaute nicht minder kaputt.
Jemand ne Idee, woran es liegt?
Muss ich in php die Textkodierung umstellen?
Kann ich dem Webadmin irgend nen Tip geben?
Weitere Infos:
Im Validator wird folgender Fehler gezeigt :
Es scheint sich um ein Symbol im Foren-Footer zu handeln....because on line 1195 .. one or more bytes that I cannot interpret as utf-8 .. The error was: utf8 "\xA0" does not map to Unicode
p.s.:
Hm.. Aha, es gibt also noch Unicode Derivate wie zB UTF-8 Hexadezimal, dort ist das Euro-Symbol nämlich 0xE2 0x82 0xAC (was meinem strangeEuro entspricht) Wie gehe ich gegen so etwas vor?
mfg chmee