UTF-8

Was ist UTF-8?

UTF-8 ist der weltweit verbreitetste Zeichenkodierungsstandard – ein System, das festlegt, wie Zeichen als Bytes gespeichert und übertragen werden. UTF-8 kann über eine Million Zeichen darstellen: von A bis Z, Umlaute, kyrillische Buchstaben, chinesische Schriftzeichen, arabische Schrift bis hin zu Emojis. Für WordPress ist UTF-8 die Standard-Zeichenkodierung – und das aus gutem Grund.

Warum UTF-8 in WordPress wichtig ist

WordPress speichert alle Inhalte in einer MySQL-Datenbank. Wenn die Datenbank, die Tabellen und die Datenbankverbindung nicht einheitlich auf UTF-8 eingestellt sind, entstehen Probleme: Sonderzeichen werden als kryptische Zeichenfolgen dargestellt (ü statt ü), Emojis werden nicht gespeichert oder führen zu Datenbankfehlern.

UTF-8 vs. utf8mb4

WordPress nutzt seit Version 4.2 standardmäßig utf8mb4 statt des älteren utf8-Formats in MySQL. Der Unterschied ist wichtig: Das alte MySQL-utf8 kann nur Zeichen mit bis zu 3 Bytes darstellen – Emojis und viele asiatische Sonderzeichen brauchen 4 Bytes. utf8mb4 unterstützt den vollständigen Unicode-Standard und löst dieses Problem.

UTF-8-Probleme erkennen und beheben

Typische Anzeichen für Zeichenkodierungsprobleme: Umlaute erscheinen als Fragezeichen oder Buchstabensalat, Emojis verschwinden beim Speichern, oder die Datenbank wirft Fehler beim Einfügen bestimmter Zeichen. In solchen Fällen lohnt ein Blick auf den Datenbankzeichensatz (im Hosting-Panel oder via phpMyAdmin) und die WordPress-Konfiguration. Beim Migrieren von WordPress-Instanzen ist UTF-8-Konsistenz einer der häufigsten Stolpersteine.