mueslirocker
Mitglied
Hallo Leute...
ich stehe gerade vor einer interessanten Frage (also für mich). Eigentlich sogar zwei Fragen. Ich stehe ziemlich am Anfang und dachte mir, dass es sinnvoll sein könnte, direkt die Öffentlichkeit mit einzubeziehen, um nicht das Rad neu zu erfinden.
Es geht um Regeln der Linguistik für den Aufbau von Wörtern.
1.) Ich möchte Regeln in einer Programmiersprache formulieren, die zu einer Zeichenkette erkennen, ob es wohl ein aussprechbares Wort ist.
2.) Ich möchte Regeln in einer Programmiersprache formulieren, die zu einer Zeichenkette erkennen, ob das Wort, das sie darstellen, sich auf ein anderes Wort oder einen Ausdruck in einer Lautsprache reimt.
Tatsächlich geht es in beiden Fällen im Endeffekt sogar um die Generierung solcher Wörter. Aber ich bin auch erstmal mit der Erkennung zufrieden.
Folgende Überlegungen habe ich bereits angestellt:
a) Ich denke, es gibt zu jenen Regeln jede Menge Ausnahmen, die man mit formulieren müsste.
b) Mindestens die erste Frage ist wohl von der Sprache (also nicht Programmiersprache) abhängig. Man müsste sowas wohl für verschiedene Länder einzeln formulieren.
c) Ich bin mir nicht sicher, ob es theoretisch reguläre Ausdrücke geben könnte, mit denen man solche Regeln formulieren kann. Das wäre aber mein erster Ansatz.
d) Falls es über RegEx's geht, würde ein vollständiger Regelsatz wohl verdammt kompliziert werden. Ich würde aber gerne kleine Probleme streichen (und damit keinen vollständigen Regelsatz erstellen), die zur Folge hätten, dass der Regelsatz sich erheblich verkleinert. Es sollen natürlich weiterhin nur korrekte Zeichenketten erkannt werden, aber ich kann damit leben, wenn nicht jede korrekte Zeichenkette als korrekt erkannt wird. Erweitern kann ich das Ganze später immernoch.
e) Ich schätze, dass es bereits solche Regeln gibt (wenn auch vielleicht nicht als RegEx formuliert), aber ich wusste nicht so wirklich, wonach ich da (bei Google) suchen sollte (bin mir schon bei dem Wort Linguistik nicht sicher, ob es passend ist, aber es erschien mir allgemein genug).
Dass nach einem Vokal ein Konsonant folgen sollte, könnte eine solche Regel sein, wobei selbst da schon x Ausnahmen existieren. Mir fehlt da irgendwie ein Einstieg.
Ich wäre dankbar für allgemeine Überlegungen zu dem Thema und natürlich besonders für Quellen, die das Thema bereits behandeln. (Ich hab ein Bild vor Augen von deinem Forum voller Sprachwissenschaftler, die das Problem schon genau diskutiert haben und mir eine Antwort geben können, die ich "nur noch" in eine Programmiersprache übersetzen muss.
)
Oder gibt es sowas vielleicht sogar schon als Projekt/Programm/Algorithmus?
ich stehe gerade vor einer interessanten Frage (also für mich). Eigentlich sogar zwei Fragen. Ich stehe ziemlich am Anfang und dachte mir, dass es sinnvoll sein könnte, direkt die Öffentlichkeit mit einzubeziehen, um nicht das Rad neu zu erfinden.
Es geht um Regeln der Linguistik für den Aufbau von Wörtern.
1.) Ich möchte Regeln in einer Programmiersprache formulieren, die zu einer Zeichenkette erkennen, ob es wohl ein aussprechbares Wort ist.
2.) Ich möchte Regeln in einer Programmiersprache formulieren, die zu einer Zeichenkette erkennen, ob das Wort, das sie darstellen, sich auf ein anderes Wort oder einen Ausdruck in einer Lautsprache reimt.
Tatsächlich geht es in beiden Fällen im Endeffekt sogar um die Generierung solcher Wörter. Aber ich bin auch erstmal mit der Erkennung zufrieden.
Folgende Überlegungen habe ich bereits angestellt:
a) Ich denke, es gibt zu jenen Regeln jede Menge Ausnahmen, die man mit formulieren müsste.
b) Mindestens die erste Frage ist wohl von der Sprache (also nicht Programmiersprache) abhängig. Man müsste sowas wohl für verschiedene Länder einzeln formulieren.
c) Ich bin mir nicht sicher, ob es theoretisch reguläre Ausdrücke geben könnte, mit denen man solche Regeln formulieren kann. Das wäre aber mein erster Ansatz.
d) Falls es über RegEx's geht, würde ein vollständiger Regelsatz wohl verdammt kompliziert werden. Ich würde aber gerne kleine Probleme streichen (und damit keinen vollständigen Regelsatz erstellen), die zur Folge hätten, dass der Regelsatz sich erheblich verkleinert. Es sollen natürlich weiterhin nur korrekte Zeichenketten erkannt werden, aber ich kann damit leben, wenn nicht jede korrekte Zeichenkette als korrekt erkannt wird. Erweitern kann ich das Ganze später immernoch.
e) Ich schätze, dass es bereits solche Regeln gibt (wenn auch vielleicht nicht als RegEx formuliert), aber ich wusste nicht so wirklich, wonach ich da (bei Google) suchen sollte (bin mir schon bei dem Wort Linguistik nicht sicher, ob es passend ist, aber es erschien mir allgemein genug).
Dass nach einem Vokal ein Konsonant folgen sollte, könnte eine solche Regel sein, wobei selbst da schon x Ausnahmen existieren. Mir fehlt da irgendwie ein Einstieg.
Ich wäre dankbar für allgemeine Überlegungen zu dem Thema und natürlich besonders für Quellen, die das Thema bereits behandeln. (Ich hab ein Bild vor Augen von deinem Forum voller Sprachwissenschaftler, die das Problem schon genau diskutiert haben und mir eine Antwort geben können, die ich "nur noch" in eine Programmiersprache übersetzen muss.

Oder gibt es sowas vielleicht sogar schon als Projekt/Programm/Algorithmus?