Arabische/Russische/kyrillische Inhalte in TYPO3


Bei größeren internationalen Webseiten ist nicht immer der Standard gesetzt, dass die Schriftzeichen den europäischen entsprechen. Will man russische Inhalte einpflegen, gilt es einige Vorbereitungen zu treffen. Dieser Artikel widmet sich einem groben Überblick über arabische Schriftzeichen, Zeichencodierungen und ASCII-Code.

Werden bei standardmäßiger Konfiguration von TYPO3 arabische/kyrillische Zeichen eingegeben, wandelt TYPO3 diese in entsprechende ASCII-Codes um. Das hängt mit der Zeichencodierung zusammen, die standardmäßig auf ISO steht.

Aus:

????? ???? ??? ?????? ???

wird dann bspw:

&a1806;&a1806;&a1806;&a1806;&a1806;&a1806;&a180 6;

Nun also zur Konfiguration:

Standardmäßig ist in TYPO3 <acronym title="International Organization for Standardization">ISO</acronym>-Codierung eingestellt. Um kyrillische (z.B. russische) Schriftzeichen darzustellen, muss die Zeichencodierung auf UTF-8 umgestellt werden. Dies geschieht folgendermaßen, auf zwei Wegen.

  1. Install Tool
    In der Option forceCharset muss der Wert utf-8 eingetragen werden.
  2. localconf.php
    In der localconf.php (/typo3/typo3conf/localconf.php) muss Folgendes hinzugefügt werden:

 

$TYPO3_CONF_VARS['BE']['forceCharset'] = 'utf-8';

 

Nun muss noch folgender Code im Haupttemplate-Setup eingefügt werden:


page.config.metaCharset = utf-8

page.config.additionalHeaders =Conte-Type:text/html;charset=utf-8

 

Hinweis: Haben Sie bereits deutsche Texte eingefügt, werden aufgrund dieser Änderungen alle vorhandenen Umlaute als Fragezeichen/Kästchen angezeigt. Dies rührt daher, dass die Sonderzeichen (noch) nicht für UTF-8 erstellt werden. Um diesem Umstand Abhilfe zu schaffen, greifen wir auf eine Erweiterung zurück, um nicht alle Umlaute nachträglich manuell umwandeln zu müssen.

Die Erweiterung heißt convert2utf8 und kann über das Extension Repository heruntergeladen werden.

Ist sie installiert, lässt sie sich über das Kontext(-popup-)menü der root-Seite der Webseite aufrufen über “Convert to UTF8?. Hat man im ersten Schritt alle zu konvertierenden Seiten ausgefwählt, stellt man im zweiten Schritt einfach “<acronym title="International Organization for Standardization">ISO</acronym>-8859-1 (Western Europe)” ein, denn das ist die Standardcodierung von TYPO3. Im finalen Schritt beginnt die Extension die Umwandlung.

Werden externe Templatedateien verwendet, die einfach inkludiert werden (z.B. von Extensions), müssen diese ebenfalls in UTF-8 konvertiert werden. Dazu müssen die Dateien einfach in einem Editor unter UTF-8 gespeichert werden.