Diskussion:UTF-32
Byte ist eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen der englischen Sprache aus dem Basis-Zeichensatz aufzunehmen. (bei ASCII: 1 Zeichen = 8 Bit = 1 Byte; bei UTF-32: 1 Zeichen = 32 Bit = 4 Oktette = 1 Byte ! Oder nicht? (nicht signierter Beitrag von 85.182.66.62 (Diskussion | Beiträge) Diskussion:UTF-32#c-85.182.66.62-2005-09-16T22:29:00.000Z11)
- Nein. Bei ASCII waeren es 7 bit, bei Unicode 21. RedNifre Diskussion:UTF-32#c-RedNifre-2008-02-15T01:34:00.000Z-85.182.66.62-2005-09-16T22:29:00.000Z11
Das war früher mal. Heutzutage gilt 1 Byte = 8 Bit. (nicht signierter Beitrag von 80.135.161.31 (Diskussion | Beiträge) Diskussion:UTF-32#c-80.135.161.31-2009-02-25T05:34:00.000Z11)
- Falsch. Vgl. Datenwort, Byte. --Benji Diskussion:UTF-32#c-Benji-2009-02-25T23:18:00.000Z-80.135.161.31-2009-02-25T05:34:00.000Z11
Auch ASCII Zeichen werden in 8 Bit codiert, wobei nur die hinteren 7 verwendet werden, beim erweiterten ASCII / ANSI sind es die vollen 8 Bit (z.B. im ISO-8859-n) Interessant bei UTF-16 und UTF-32 ist auch daß Nullbytes enthalten sein können. Textinterpreter, welche das Nullbyte als String-Ende interpretieren, können hier Probleme bekommen. Auch ein wichtiger Aspekt für C-Programmierer. (nicht signierter Beitrag von 37.209.77.237 (Diskussion) Diskussion:UTF-32#c-37.209.77.237-2012-12-12T21:47:00.000Z11)
Angeblicher Vorteil des O(1)-Zugriffes
[Quelltext bearbeiten]Der Vorteil existiert nur, wenn man 1 Zeichen = 1 Codepoint festlegt. Je nach Unicode-Normalisierungsform brauchen Zeichen mit Diakritika aber mehr als einen Codepoint, etwa wenn ein Ü als <U+0055 U+0308> kodiert wird (wie es z.B. bei OS X geschieht). Für viele Zeichen-Diakritika-Kombinationen existieren auch gar keine "pre-composed" Zeichen, so dass man diese mit mehreren Codepoints ausdrücken muss, etwa kyrillische Vokale mit Betonungszeichen. Wer also meint, mit der Verwendung von UTF-32 müsse er sich um Zeichenkodierungen mit variabler Länge nicht mehr herumplagen, macht es sich zu einfach oder unterstützt (ggf. unwissentlich) nur eine Teilmenge von Unicode. :-( --RokerHRO Diskussion:UTF-32#c-RokerHRO-2010-03-15T09:42:00.000Z-Angeblicher Vorteil des O(1)-Zugriffes11
Unicode Standard
[Quelltext bearbeiten]"Im aktuellen Unicode Standard 5.1 [...]", das ist doch nicht mehr im Ansatz aktuell, oder? Wir sind inzwischen bei v11. Felix D. (Diskussion) Diskussion:UTF-32#c-Divof-2018-09-09T09:40:00.000Z-Unicode Standard11