regular expression für Umlaute

StudentZHW

Grünschnabel
Hallo zusammen

Ich suche eine Pattern, damit ich bei der Validierung sämtliche Zeichen im Alphabet und auch die üblichen Umlaute (ä,ö,ü,é,è) überprüfen kann.

Ich habe es mit [A-Za-zäöüÄÜÖéè ] ausprobiert, aber da erhalte ich eine Fehlermeldung:
Code:
Invalid byte 2 of 3-byte UTF-8 sequence.
. Dies liegt daran, dass ich mein Dokument im UTF-8 codiere.

Gibt es eine möglichkeit beim Erstellen eines Patterm auch den ASCII Code direkt einzutragen?

Ich danke euch für euer Feedback.
 
Dies liegt daran, dass ich mein Dokument im UTF-8 codiere.
Das Problem ist wohl eher, dass das Dokument nicht mit UTF-8 kodiert ist. Wahrscheinlich nutzt du hingegen ISO 8859-1 oder ähnliches, da das „ä“ dort mit 0xE4 kodiert wird, was in UTF-8 das erste Byte einer 3-Byte-Sequenz ist. Das darauf folgende Byte (hier das „ö“) ist bei ISO 8859-1 mit 0xF6 kodiert, was in UTF-8 jedoch keine gültige Kodierung ist. Genau das sagt ja auch die Fehlermeldung.
 
Danke für die Antwort


Kann mir jemand sagen, wie ich ein pattern machen kann mit \w und dem space?
bzw. wie kann ich mehrere expression aneinanderfügen?
 
Zurück