Codierung verstehen >

webdev

Mitglied
Der Thread "grosse mysql-Datei bearbeiten - Tool gesucht" (ebenfalls in diesem Forum) hat sich erledigt > Ich weiss leider nicht, wie ich ihn löschen kann...

Nun habe ich ein anderes Problem. In einer der Tabellen wird der Inhalt der Website abgelegt. Ich möchte in dieser Tabelle nun html-Tags ändern/ersetzen, aber leider verstehe ich die Codierung nicht. Da steht z.B.

%3CP+class%3Dtext%3E

was so viel heisst wie <P class="text">

Frage: gibt es eine Tabelle (ascii-code?) wo ich die einzelnen Zeichen nachschlagen kann? Ich muss ja wissen, wo der Tag beginnt und wo er endet...

Der Code oben stammt von einer mysql-Datenbank bzw. aus einer Tabelle daraus. Die Version von mysql ist 4.0.24_Debian, die Sprache ist auf 'German (de-iso-8859-1) eingestellt.

Danke für jeden Tipp!
 
webdev hat gesagt.:
Der Thread "grosse mysql-Datei bearbeiten - Tool gesucht" (ebenfalls in diesem Forum) hat sich erledigt > Ich weiss leider nicht, wie ich ihn löschen kann...
Den kannst du gar nicht löschen. Auch bei Tutorials.de ist es so wie in jedem anderen Forum auch, dass normale User keine Thread löschen können ;)
Was du aber tun kannst und auch SOLLTEST, ist den Beitrag auf "Erledigt" setzen (Schau mal neben den Button "Antworten" ;) )
webdev hat gesagt.:
Nun habe ich ein anderes Problem. In einer der Tabellen wird der Inhalt der Website abgelegt. Ich möchte in dieser Tabelle nun html-Tags ändern/ersetzen, aber leider verstehe ich die Codierung nicht. Da steht z.B.

%3CP+class%3Dtext%3E

was so viel heisst wie <P class="text">

Frage: gibt es eine Tabelle (ascii-code?) wo ich die einzelnen Zeichen nachschlagen kann? Ich muss ja wissen, wo der Tag beginnt und wo er endet...

Der Code oben stammt von einer mysql-Datenbank bzw. aus einer Tabelle daraus. Die Version von mysql ist 4.0.24_Debian, die Sprache ist auf 'German (de-iso-8859-1) eingestellt.

Danke für jeden Tipp!
Wie du schon festgestellt hast, eine Ascii-Tabelle. Und die wirst du doch sicherlich selbst finden im Internet, oder?
Wenn in der die Codierung anders ist, schau in einer Ansi- oder Unicode-Tabelle.
Noch ein kleiner Tipp: Die Zeichen sind Hex-Codiert. Du solltest dir also auch eine Tabelle suchen, die diese Spalte mit enthält.
 
Hi niggo

danke für die Antwort. Nun ja, ganz so einfach war es nicht, aber ich habe das Problem lösen können.

1. http://www.asphelper.de/Referenz/EBCDIC.asp > diese Tabelle zeigt den Hexa-Wert der gesuchten Ascii-Zeichen. '3C' entspricht dem '<'-Zeichen

2. Damit ist klar, was zur html-Codierung gehört und kann entsprechend ersetzt werden.

3. Für die 'Suchen & Ersetzen'-Arbeit kann ich das Tool 'EditPad™ Pro' empfehlen, welches man hier http://www.editpadpro.com/buynow.html downloaden bzw. kaufen kann. Es markiert die Codepassagen farbig und ist sehr flink.
 
webdev hat gesagt.:
Nun ja, ganz so einfach war es nicht, aber ich habe das Problem lösen können.
Hätte auch ziemlich simpel mit JavaScript gelöst werden können:

alert(decodeURI('%3CP+class%3Dtext%3E').replace(/\+/, ' '));

Dieser String ist nämlich – wie zur Übergabe via HTTP GET üblich – URL-codiert. Wie und warum sowas in die Datenbank kommt sollte, ist mir allerdings schleierhaft. Mit dem Zeichensatz hat das nichts zu tun.
 
ähm, ob das effizienter ist, weiss ich nicht. Die Datei/Tabelle stammt aus einer mysql-DB. Ich hab hier bloss ein Beispiel einer Such-Ersetz-Aktion aufgeführt. Insgesamt werden es zig solche Aktionen werden, da der gesamte Code in xhtml / html strict umgeschrieben wird. Die Datei wandert anschliessend gesäubert via dump wieder in die DB.

Aber danke trotzdem für den Tipp!
 
Zurück