Zeichensatz->UTF8-Probleme und Mysql-dumper

phpBB 3.0 hat sein "End of Life" erreicht. Eine Neu-Installation wird nicht mehr unterstützt.
Gesperrt
DarthObelix
Mitglied
Beiträge: 77
Registriert: 10.01.2008 09:52

Zeichensatz->UTF8-Probleme und Mysql-dumper

Beitrag von DarthObelix »

Könnt Ihr ja auch mal testen, mit der Version mysql-Dumper 1.23 pr REV257, einer DB die auf UTF8 läuft, nur Inhalte in UTF8 sind, die Felder auf UTF8 stehen, der Dumper auf UTF8 steht, erhalte ich ein Backup, das zumindest in Teilbereichen auf latin1_bin steht, Sortierung ist: latin1_german2_ci. Damit dürften sich einige Probleme erklären lassen!

Könnt Ihr ja auch über Zurückspielen in eine andere DB testen, dann habt Ihr auf einemal eine Latin-DB :grin:

Bei einem Dump ist alles korrekt!

Testet das mal, so würde ich sagen, der Dumper geht nicht sauber mit den Zeichensätzen um, wenn ich was übersehen haben sollte, könnt Ihr mir das ja gerne sagen!

***mysql-Ver: MySQL 4.1.22***
Murpy is everywhere...
Benutzeravatar
Mahony
Ehemaliges Teammitglied
Beiträge: 12179
Registriert: 17.11.2005 22:33
Wohnort: Ostfildern Kemnat
Kontaktdaten:

Beitrag von Mahony »

Hallo
Deiner Aussage kann ich nicht zustimmen. Lies dir einfach mal das hier durch Die Umlautproblematik, damit du die Zusammenhänge auch wirklich verstehst.

Wichtig ist nur was bei character_set_client und character_set_connection angegeben ist und nicht die Collation.
mysqldumper.de hat geschrieben:Um an dieser Stelle direkt mit einem weiteren, weit verbreiteten Irrglauben aufzuräumen:
die Collation (Kollation=Sortierreihenfolge) wirkt sich in keinster Weise beim Einspielen von Daten aus.
Lediglich beim Auslesen der Datenbank durch Queries mit "ORDER BY"-Klausel wird so festgelegt, nach welchen Kriterien sortiert werden soll. Siehe offizielle MySQL-Dokumentation: http://dev.mysql.com/doc/refman/5.1/de/ ... -sets.html


Grüße: Mahony
Taekwondo in Berlin
Wer fragt, ist ein Narr für fünf Minuten, wer nicht fragt, ist ein Narr für immer.
Benutzeravatar
DSB
Mitglied
Beiträge: 172
Registriert: 21.08.2004 12:31
Wohnort: bei Bremen
Kontaktdaten:

Re: Zeichensatz->UTF8-Probleme und Mysql-dumper

Beitrag von DSB »

DarthObelix hat geschrieben:Könnt Ihr ja auch mal testen, mit der Version mysql-Dumper 1.23 pr REV257, einer DB die auf UTF8 läuft, nur Inhalte in UTF8 sind, die Felder auf UTF8 stehen, der Dumper auf UTF8 steht, erhalte ich ein Backup, das zumindest in Teilbereichen auf latin1_bin steht
Die Kodierung der Backupdatei hat primär überhaupt gar nichts mit der Kodierung der darin enthaltenen Tabellen zu tun! Dies ist ebenfalls ein Denkfehler, der leider weit verbreitet ist. Oft wird hier aus Verzweiflung versucht die Parameter CHARSET=xxx händisch vermeintlich anzupassen, was natürlich nicht zum Erfolg führt.

Es ist möglich, dass innerhalb einer Datenbank - und damit innerhalb eines Backups - verschiedene Tabellen in latin1 kodiert sind während andere in utf8 oder ganz anders kodiert sind. Das spielt aber keine Rolle in Bezug auf die Wiederherstellung. Es geht einzig und allein darum, dass der MySQL-Server weiß, in welcher Kodierung Daten vom PHP-Skript geliefert werden. Die korrekte Umwandlung erfolgt dann intern durch den MySQL-Server und alles wird gut.

Deine Vermutung:
in Teilbereichen auf latin1_bin steht, Sortierung ist: latin1_german2_ci. Damit dürften sich einige Probleme erklären lassen!
ist deshalb technisch betrachtet falsch.
fortiso
Mitglied
Beiträge: 64
Registriert: 21.12.2007 19:06

Beitrag von fortiso »

Es gibt ein Idiotensicheres kleines Programm, welches die Umlaute auswechselt. Wenn du interesse hast, FORENSUCHE! (habs min. 5 mal bereits hier im Forum reingeschrieben!

Eine Datei in dein Webspace kopieren, dass Programm mit Windows starten, Umlaute korrigieren, fertig! schafft jeder Idiot! :D
Benutzeravatar
DSB
Mitglied
Beiträge: 172
Registriert: 21.08.2004 12:31
Wohnort: bei Bremen
Kontaktdaten:

Beitrag von DSB »

Stimmt, das kenne ich.
Ich habs programmiert. ;)
Gesperrt

Zurück zu „[3.0.x] Installation, Update und Konvertierung“