Zeilenende und Kodierung einer Textdatei bestimmen.

Das ist mir bewusst aber es gibt ja auch noch Kodierungen wie ISO-8859-X, CpXXX oder MacXXXXX. Dazu kommen noch die asiatischen Kodierungen.
 
Ich sagte ja bereits, dass außer wenn spezielle Kodierungen wie etwa die Unicode-Kodierungen UTF genutzt werden, die eine signifikante Bitstruktur haben (sowohl die BOM als auch die Bitsequenzen der einzelnen Zeichen selbst), es nicht möglich ist von der Kodierung auf den Zeichensatz zu schließen. Erst wenn die Bitsequenzen auf einen beliebigen Zeichensatz abgebildet werden, kann geprüft werden, ob das Ergebnis sinn ergibt, ob der Text also beispielsweise irgendwelche sinnlosen Zeichenfolgen enthält oder nicht. Und da hilft eben die im Editor oder Betriebssystem eingestellte Standardzeichenkodierung beziehungsweise der Standardzeichensatz von dem aus dann auf die Kodierung geschlossen wird. In den meisten Fällen ist das ISO-8859-1 (auch „Latin 1“ genannt) oder bei Windows-Betriebssystem Windows-1252, der sich von ISO-8895-1 in ein paar Zeichen unterscheidet.
 
Zurück