Zeichensatz

Stand: 09/2019

 

1. Allgemeines

In Aleph wird der Zeichensatz Unicode verwendet. In Unicode haben nicht nur einzelne Zeichen (z.B. der lateinische Buchstabe „a“ = 0061) einen konkreten Unicode-Wert, sondern auch Zeichen in Verbindung mit einem oder mehreren Diakritika (z.B. ă = 0103). Im zweiten Fall (ă) spricht man von sog. präkombinierten Zeichen.

Aber auch die Diakritika selbst haben einen konkreten Unicode-Wert (z.B. hat der übergesetze Halbkreis ˘ den Unicode-Wert 0306). Diese Diakritika verstehen sich als Kombinationszeichen (kombinierende Diakritika), d.h. sie dürfen nur in Verbindung mit einem Grundzeichen verwendet werden (Grundzeichen vor Diakiritikum).

 

2. Trema bzw. Umlaut

Im Zeichensatz Unicode werden Trema und Umlaut gleich behandelt. Für die

Indexierung und die Sortierung wird im deutschsprachigen Raum aber eine Unterscheidung zwischen Trema und Umlaut benötigt. Die Unterscheidung wird durch verschiedenartige Eingaben erreicht.

Die Eingabe Grundbuchstabe mit Trema als präkombiniertes Zeichen (= ein Unicodewert
für den Grundbuchstaben und das Diakritikum zusammen) wird verwendet für:

- die deutschen Umlaute (Eingabe über die Tastatur, z.B. 00C4 = Ä)
- die Grundbuchstaben mit Trema, bei denen der Grundbuchstabe nicht für die deutschen
Umlaute gebraucht wird (Eingabe über die Sonderzeichenauswahl, z.B. 00CB = Ë)

Die Eingabe des Grundbuchstaben mit Trema als postkombiniertes Zeichen (= ein
Unicodewert für den Grundbuchstaben und ein weiterer Unicodewert für das Diakritikum) wird verwendet für:
- die Grundbuchstaben mit Trema, bei denen der Grundbuchstabe für die deutschen Umlaute gebraucht wird (Eingabe über die Sonderzeichenauswahl (zwei
Klicks), z.B. 0041 = A und 0308 = Trema)

In der Sonderzeichenauswahl, Tab "Trema" findet man am Anfang das große und kleine Aa, Oo und Uu jeweils mit dem nachgestellten Trema.

Nach oben