Mehrsprachigkeit / Ländercodes / UTF8

Mik3e

Erfahrenes Mitglied
Hi,

Ich bin derzeit dabei ein System zu entwickeln, dass unterschiedliche Sprachen und Zeichensätze unterstützt.

Zum Beispiel:

- Deutsch
- Englisch
- Israelisch
- Chinesisch
etc.

Dazu mehrere Fragen:

1. Zeichensätze:
Soweit ich mich bisher auskenne, ist UTF-8 der "globale" Zeichensatz. Ein Standard, der alle Zeichen zur Verfügung stellt. Ist das korrekt?

2. Site Codierung:
Die Codierung der Site habe ich daher mit UTF-8 festgelegt:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
Ist das korrekt? Kann ich mit dieser Einstellung beispielsweise auch Chinesische Zeichen abbilden?

3. Datenbank Kollationen (mein DBMS: MySQL 5.0.13):
In den neuen MySQL Versionen (zumindest ist es mir bei 4.1 noch nicht aufgefallen), kann man für jedes Attribut die Kollation festlegen. Hier habe ich "utf8_general_ci" für VARCHAR und TEXT Felder gewählt.

Schreibe ich nun mit der oben beschriebenen Konfiguration ein Sonderzeichen in die Datenbank ("Ö,Ä etc"), wird es mit
PHP:
echo utf8_encode($sonderzeichen);
korrekt dargestellt (allerdings nicht HTML Encoded <- logisch).

Vielleicht hat jemand von Euch Erfahrung damit oder kennt ein gutes Tutorial zu diesem Thema. Ich bin vor lauter Reference Manuals und Standards die ich in den letzten Stunden gelesen habe schon total verwirrt ;)

Danke & Ciao,
Mike
 
Soweit ich mich bisher auskenne, ist UTF-8 der "globale" Zeichensatz. Ein Standard, der alle Zeichen zur Verfügung stellt. Ist das korrekt?
UTF-8 ist eine Unicode-Zeichenkodierung. Unicode umfasst jedoch „jedes sinntragende Zeichen bzw. Textelement aller bekannten Schriftkulturen und Zeichensysteme“.

Die Codierung der Site habe ich daher mit UTF-8 festgelegt:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
Ist das korrekt? Kann ich mit dieser Einstellung beispielsweise auch Chinesische Zeichen abbilden?
Mit der Deklaration hast du micht die Kodierung festgelegt sondern nur notiert, welche Kodierung der User Agent nutzen soll, um das Dokument korrekt interpretieren zu können. Die Kodierung findet mit dem Editor statt und nicht durch die Auszeichnung einer Kodierung. Außerdem sollte die Zeichenkodierung in einem übergeordnetem Protokoll (beispielsweise HTTP) beschrieben werden und nicht erst vom Dokument selbst.
 
Hi,

vorweg danke für die Infos...
Zum ersten Post: Die technische Umsetzung der Mehrsprachigkeit ist schon fertig (Logik), da brauchts keine Hilfe :)

Es geht mir darum, das System korrekt für alle gültigen Symbole vorzubereiten (vor allem auch den asiatischen Raum).

Und irgendwie verstehe ich beim zweiten Post nur Bahnhof :) (Sorry)...

Ciao,
Mike
 
Zurück