Portal Diskussion:Unicode/Archiv/2010

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

O'Connor ode O’Connor?

Um welches Zeichen geht es hier eigentlich: en:O'Connor oder de:O’Connor? Besten Dank! – Simplicius Portal Diskussion:Unicode/Archiv/2010#c-Simplicius-2010-02-14T08:27:00.000Z-O11

Hier haben wir einmal den normalen Hochstrich, und dann den typographisch korrekten Apostroph. Letzterer ist eigentlich korrekt, aber schwieriger einzutippen, weswegen er nicht all zu häufig verwendet wird. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-02-14T09:26:00.000Z-Simplicius-2010-02-14T08:27:00.000Z11
In diesem Fall ein typografischer Apostroph. Vor Kurzem ist mir in amtlichen Urkunden der Name Alʼin begegnet. Darin müsste es wegen Transliteration aus dem Arabischen U+02BC ʼ Modifikationsbuchstabe Apostroph sein. „Modifizierender Apostroph“ in der Liste ist falsch, da es sich bei diesen Zeichen ausdrücklich um Buchstaben handelt. Dies muss sich beispielsweise auf eine Blockmarkierung mit Doppelklick auswirken. -- Rainer Seitel Portal Diskussion:Unicode/Archiv/2010#c-Rainer Seitel-2010-02-21T20:15:00.000Z-Simplicius-2010-02-14T08:27:00.000Z11

Auf der Seite Unicode-Block Altgriechische Zahlzeichen11 ist ein nicht mehr funktionierender Link:

Proposal to encode Greek Acrophonic characters in the UCS (Complete Outline of Ancient Greek Acrophonic Numerals; PDF-Datei)

-- Hakris Portal Diskussion:Unicode/Archiv/2010#c-Hakris-2010-03-14T14:37:00.000Z-Broken Link11

Sollte jetzt wieder funktionieren. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-03-14T14:43:00.000Z-Hakris-2010-03-14T14:37:00.000Z11

Offizielle Bezeichnung von Steuerzeichen

ZU Unicode-Block Basis-Lateinisch11 und in Unicode-Block Lateinisch-1, Erg%C3%A4nzung11

Für die Codes von 0 (Null) bis dezimal 31 (Hexadezimal 0000 bis 001F) sowie von dezimal 127 bis 159 (Hexadezimal 007F bis 009F) gibt es zwar nach ISO/IEC 8859-1 und ISO/IEC 10646 keine druckbaren Zeichen, die Steuercodes sind aber bei Unicode.org festgelegt: http://www.unicode.org/charts/PDF/U0000.pdf sowie http://www.unicode.org/charts/PDF/U0080.pdf, ftp://ftp.unicode.org/Public/5.2.0/ucd/UnicodeData.txt, siehe auch: Steuerzeichen11.

Von daher würde ich vorschlagen, die englischen Bezeichnungen der Steuerzeichen in die Spalte "Offizielle Bezeichnung" aufzunehmen.

-- Hakris Portal Diskussion:Unicode/Archiv/2010#c-Hakris-2010-03-14T14:37:00.000Z-Offizielle Bezeichnung von Steuerzeichen11

Unter der Spalte für die offizielle Bezeichnung, sowohl im PDF als auch in der Datenbank, steht schlichtweg <control>. Namen haben sie damit offiziell nicht. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-03-14T14:46:00.000Z-Hakris-2010-03-14T14:37:00.000Z11

Was tun mit Unicode-Lemmata?

Seid gegrüßt Unicoder ;)

Seit einiger zeit fällt mir auf, dass es beim Umgang mit Unicode-Lemmata ein paar Inkonsistenzen gibt. Offensichtlich gibt es mehrere Ansichten, was mit solchen Lemmata passieren soll, und alle Varianten sind im Moment mehr oder weniger im Einsatz. Mir sind bisher hier folgende "Philosophien" zu dem Thema aufgefallen:

  • Unicode-Lemmata brauchen wir nicht
    • Hauptargument ist: Das gibt sowieso sogut wie keiner ein.
    • Mein gegenargument: Wenn ich auf einer Webseite ein Unicode-Symbol sehe, mit dem ich nichts anfangen kann, würde ich es gerne in das suchfeld von WP copy&pasten.)
    • Beispiele: , , (Alle 3 haben eine Löschung wegen genau dem hinter sich)
  • Unicode-Lemmata redirecten auf das, was sie darstellen.
    • Hauptargument: Naheliegendste Lösung. en.wikipedia.org machts auch so.
    • Gegenargumente: Uneindeutig und Interpretationsspielraum. Das Komet-Symbol kann sowohl einfach ein Komet, als auch ein Meteorlogisches Symbol sein.
    • Beispiele: , ,
  • Unicode-Lemmata redirecten auf den entsprechenden Unicode-Block
  • Unicode-Lemmata sind eigene Artikel
    • Beispiel: (wobei U+F8FF vlt ein Sonderfall ist)

Bei zum Beispiel arabischen Schriftzeichen ist es vlt eindeutig, aber mindestens beim Unicode-Block Verschiedene Symbole ist bisher alles vertreten. Und hier hätte ich gerne einen Konsens. Gibts Vorschläge, wie man das lösen könnte? Sollte es hier in der Diskussion jetzt keinen eindeutigen Konsens geben, wäre es auch möglich, ein Meinungsbild zu dem Thema zu erstellen.

--Stummi(D¦B) Portal Diskussion:Unicode/Archiv/2010#c-Stummvoll-2010-03-30T15:52:00.000Z-Was tun mit Unicode-Lemmata?11

Ich würde für eine Mischung aus der zweiten und dritten Lösung tendieren. Wo die Sache eindeutig ist (etwa weil das Symbol selbst einen Artikel hat (etwa beim Totenkopf (Symbol)) gibt's einen Redirect darauf; in unschlüssigen Fällen auf den Unicode-Block, der ja auch eine Erklärung beinhaltet. --TheK? Portal Diskussion:Unicode/Archiv/2010#c-TheK-2010-03-30T18:44:00.000Z-Stummvoll-2010-03-30T15:52:00.000Z11
Das würde so dann aber wohl nur bei den Symbolen zutreffen. Bei einzelnen Schriftzeichen sehe ich keinen Mehrwert darin, sie irgendwohin weiterzuleiten. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-03-30T21:22:00.000Z-TheK-2010-03-30T18:44:00.000Z11
Die Frage ist dann, *was* denn alles noch unter eindeutig fällt? Ist das Schneemansymbol zum Beispiel eindeutig? --Stummi(D¦B) Portal Diskussion:Unicode/Archiv/2010#c-Stummvoll-2010-03-31T12:35:00.000Z-TheK-2010-03-30T18:44:00.000Z11

Frage: Wäre es vielleicht sinnvoller, den Block , "Greek Extended" (Grec étendu) mit "Griechisch-Ergänzung" zu übersetzen? -- Hakris Portal Diskussion:Unicode/Archiv/2010#c-Hakris-2010-04-14T13:32:00.000Z-Was tun mit Unicode-Lemmata?11

Die anderen zwei Blöcke mit "Extended" heißen auch Lateinisch, weiterer Zusatz und Äthiopisch, Zusatz. Ergänzung hingegen entspricht dem englischen "Supplement", siehe die Blöcke Kyrillisch, Ergänzung und Arabisch, Ergänzung. Unter dem Gesichtspunkt finde ich das keine gute Idee und glaube, wir sollten bei den Übersetzungen genau bleiben. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-04-14T16:16:00.000Z-Hakris-2010-04-14T13:32:00.000Z11

Suchfunktion

Ich möchte gerne wissen, welche Unicode-Nummern für ] und [ vergeben sind. Wo findet man entsprechende Suchfunktion? -- 77.181.255.2 Portal Diskussion:Unicode/Archiv/2010#c-77.181.255.2-2010-04-16T17:02:00.000Z-Suchfunktion11

Interessanterweise nicht in der Wikipedia-eigenen Suche, da diese die Zeichen anscheinend gar nicht findet. Es gibt allerdings z. B. das hier. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-04-16T20:49:00.000Z-77.181.255.2-2010-04-16T17:02:00.000Z11

Doppelte Namensangabe in Artikeln zu Unicode-Blöcken (erl.)

Hallo. In Abstimmung mit Reiner Stoppok möchte ich folgendes zur Diskussion stellen: In [1] habe ich die Meinung vertreten, dass bei derartigen Artikeln (z.B. Unicode-Block Limbu) der deutsche Name nicht nochmal explizit genannt werden soll (und schon gar nicht fettgedruckt), wenn er mit dem internationalen Namen übereinstimmt. In Fällen, in denen die Bezeichnung NICHT übereinstimmt (z.B. Unicode-Block Basis-Lateinisch) soll die deutsche Übersetzung allerdings genannt werden, aber vielleicht eher als ({{DeS|''Basis-Lateinisch''}}). Wie seht ihr das? Gruß... --Krd Portal Diskussion:Unicode/Archiv/2010#c-Krd-2010-07-08T10:24:00.000Z-Doppelte Namensangabe in Artikeln zu Unicode-Blöcken (erl.)11

Es wäre ziemlich dumm, die deutsche Bezeichnung nicht einzufetten, schließlich stellt sie ja den Seitentitel dar, und der soll nach unseren Konventionen fettgedruckt sein. Bis jetzt war das allerdings die Praxis - die englische Bezeichnung war eingefettet, die deutsche hingegen komplett unformatiert. Ganz klar ist allerdings, dass in Fällen, in denen der deutsche und der englische Name identisch ist, der Name nur einmal genannt werden muss. Ich sehe da absolut keinen Sinn in einer Doppelnennung. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-07-08T10:42:00.000Z-Krd-2010-07-08T10:24:00.000Z11
Ein einheitliches Erscheinungsbild fände ich nicht schlecht. --Reiner Stoppok Portal Diskussion:Unicode/Archiv/2010#c-Reiner Stoppok-2010-07-08T10:50:00.000Z-Prince Kassad-2010-07-08T10:42:00.000Z11 PS: Ich hatte mich in einigen Fällen (bei der einfachen Nennung) tatsächlich gefragt, ob das, was da steht, eine Übersetzung oder das Englische sein sollte.
Eigentlich sollte es kein Problem darzustellen, einfach die Fettschrift aus der englischen Bezeichnung zu entfernen. Damit wäre dann wirklich nur der Seitentitel fettgedruckt. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-07-08T11:00:00.000Z-Reiner Stoppok-2010-07-08T10:50:00.000Z11
Und Unicode-Block?! --Reiner Stoppok Portal Diskussion:Unicode/Archiv/2010#c-Reiner Stoppok-2010-07-08T11:05:00.000Z-Prince Kassad-2010-07-08T11:00:00.000Z11 PS: Hm, vielleicht sollte das doch besser gar nicht angerührt werden. (Vielleicht habe ich das hier etwas übertrieben mit der Einheitlichkeit.)
"Unicode-Block" gehört IMHO zum Namen und auch zum Seitentitel und soll daher fettgedruckt bleiben. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-07-08T11:09:00.000Z-Reiner Stoppok-2010-07-08T11:05:00.000Z11
Ok. Alles wie gehabt. ;) --Reiner Stoppok Portal Diskussion:Unicode/Archiv/2010#c-Reiner Stoppok-2010-07-08T11:38:00.000Z-Prince Kassad-2010-07-08T11:09:00.000Z11

Vorschlag zur einheitlichen Formatierung

Nach den WP-Formatierungsregeln sollte zu Beginn stets das Lemma in bold wiederholt werden. Bei den Unicode-Blöcken ist zusätzlich die Verlinkung sinnvoll, und das ganze soll noch exakt (also mit der Unicode-offiziellen Benamung) und noch optimal lesbar sein. IMHO ist dies alles nur mit der folgenden Formatierung zu leisten:
Der Unicode-Block Tibetan (Tibetisch) (0F00–0FFF) ...
Denkbar wäre (weniger gut) auch stattdessen
Der Unicode-Block Tibetisch („Tibetan“, 0F00–0FFF) ...
wozu in beiden Varianten, oder zumindest in der zweiten, die Originalbezeichnung (Tibetan) auch kursiv gesetzt werden könnte.

Leider sind immer noch alle möglichen anderen Darstellungsformen vorhanden. Ich schlage vor, bei nötigen Änderungen ggf. immer auch gleich den Artikelbeginnn zu vereinheitlichen. Ok? -- sarang사랑 Portal Diskussion:Unicode/Archiv/2010#c-Sarang-2010-09-18T08:03:00.000Z-Vorschlag zur einheitlichen Formatierung11

Einverstanden. Wenn „Tibetisch“ eine offizielle Bezeichnung ist und mit der Übersetzung somit nicht gegen Wikipedia:Keine Theoriefindung verstoßen wird, wäre ich für die Einleitung
Der Unicode-Block Tibetisch (englisch Tibetan) (0F00–0FFF) ...
Grüße --RonaldH Portal Diskussion:Unicode/Archiv/2010#c-RonaldH-2010-09-18T08:18:00.000Z-Sarang-2010-09-18T08:03:00.000Z11
Die englische Bezeichnung sollte auf jeden Fall nach hinten. Schließlich erscheint diese Bezeichnung nicht im Lemma, und solange sie noch hintendran erscheint, gäbe es auch keine Probleme mit TF. Außerdem entspricht das dann auch den Tabellen, wo die englische Bezeichnung ebenfalls als letztes erscheint. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-09-18T08:45:00.000Z-Sarang-2010-09-18T08:03:00.000Z11
Ja, so erscheint es mir am sinnvollsten. Aber ihr wisst ja, wieviele Unicode-Block-Artikel es gibt – da sollten die vielen verschiedenen Schreibweisen alle nach und nach vereinheitlicht werden... Mit einem Tool ist das wohl schwierig zu machen? -- sarang사랑 Portal Diskussion:Unicode/Archiv/2010#c-Sarang-2010-09-18T10:19:00.000Z-Prince Kassad-2010-09-18T08:45:00.000Z11
Naja... 150 Artikel kann man auch von Hand noch ändern, man braucht nur etwas Zeit. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-09-18T13:21:00.000Z-Sarang-2010-09-18T10:19:00.000Z11
Noch eine kleine Änderung:
Der Unicode-Block Tibetisch (englisch Tibetan, 0F00–0FFF) ...
vermeidet die zweimalige Klammerung und fasst die beiden Details in einer Klammer zusammen. Sieht IMHO besser aus – und wenn wir schon umfassend ändern und verbessern, sollte es optimal sein. Wenn da Konsens signalisiert wird, könnte ich beginnen [aber es ist ja weder wichtig noch eilig, und nur deswegen muss auch kein Block sofort angefasst werden].-- sarang사랑 Portal Diskussion:Unicode/Archiv/2010#c-Sarang-2010-09-29T04:07:00.000Z-Prince Kassad-2010-09-18T13:21:00.000Z11
Gut und gerne. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-09-30T09:43:00.000Z-Sarang-2010-09-29T04:07:00.000Z11
Hab auch nichts dagegen. Ein systematisches Abarbeiten der 150 Artikel wäre sicherlich vorzuziehen, um keinen der Artikel liegen zu lassen. --RonaldH Portal Diskussion:Unicode/Archiv/2010#c-RonaldH-2010-10-02T13:09:00.000Z-Prince Kassad-2010-09-30T09:43:00.000Z11
Nach weiterem nachdenklichen Betrachten finde ich es besser, in der Klammerung zuerst die Bereichsangabe und dann (ev. nach ein klein wenig deutlicherem Zwischenraum) die englische Bezeichnung zu schreiben − sonst könnte der Bereich wie ein Bestandteil des Englischen aussehen; auch erscheint mir der Bereich eine wichtigere Info zu sein als der sprachliche Hinweis. Nun also
Der Unicode-Block Verschiedene mathematische Symbole-B (2980–29FF; englisch Miscellaneous Mathematical Symbols-B) ...
Tut mir leid, dass ich da immer wieder mit Neuem komme − aber wenn wir schon alle UnicodeBlock-Artikel ändern wollen, dann möglichst optimal und relativ endgültig! -- sarang사랑 Portal Diskussion:Unicode/Archiv/2010#c-Sarang-2010-10-16T08:08:00.000Z-Prince Kassad-2010-09-18T13:21:00.000Z11
Das wiederum finde ich keine gute Wahl. Der Bezug der englischen Übersetzung zu dem deutschen Text wird durch die Blockangabe optisch gestört. Um das Subjekt des Einleitungssatzes nicht zu überfrachten und einen der beiden Klammerzusätze aufzulösen, schlage ich vor:
Der Unicode-Block Tibetisch (englisch Tibetan) umfasst die Unicode-Nummern 0F00 bis 0FFF. <Nächster Satz>
Grüße --RonaldH Portal Diskussion:Unicode/Archiv/2010#c-RonaldH-2010-10-16T09:03:00.000Z-Sarang-2010-10-16T08:08:00.000Z11
Du hast recht, die Blockangabe würde die deutsche Bezeichnung (das Lemma) vom englischen Originaltitel zu weit entfernen. Ist wirklich nicht einfach. Keinesfalls aber geht „Unicode-Nummern“ für den Codepoint-Bereich. Um den Einleitungssatz kurz zu halten, bleibt es wohl am besten bei
Der Unicode-Block Tibetisch (englisch Tibetan; 0F00–0FFF) umfasst die Zeichen der ...
(getrennt mit Semicolon und etwas deutlicherem Zwischenraum). Damit gebe ich Ruhe, versprochen. -- sarang사랑 Portal Diskussion:Unicode/Archiv/2010#c-Sarang-2010-10-18T18:52:00.000Z-RonaldH-2010-10-16T09:03:00.000Z11

Unicode-Block Verschiedene piktografische Symbole

Mag jemand korrekturlesen? -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-12-24T21:38:00.000Z-Unicode-Block Verschiedene piktografische Symbole11

Vielen Dank für die Arbeit! Mit welchem Font kann ich mir die Symbole denn anzeigen lassen? Betriebssystem ist Windows XP, Browser ist IE 7. Auf Anhieb kann ich erkennen, dass da etliche BKL-Seiten verlinkt sind. Die müssten noch aufgelöst werden. --RonaldH Portal Diskussion:Unicode/Archiv/2010#c-RonaldH-2010-12-24T22:20:00.000Z-Prince Kassad-2010-12-24T21:38:00.000Z11
http://users.teilar.gr/~g1951d/ und von dort die Schriftart Symbola herunterladen. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-12-24T22:38:00.000Z-RonaldH-2010-12-24T22:20:00.000Z11
Danke. Habe die Schriftart installiert, sie wird aber von dem IE7 nicht zur Darstellung der Symbole herangezogen. Weißt Du, woran das liegen könnte? --RonaldH Portal Diskussion:Unicode/Archiv/2010#c-RonaldH-2010-12-24T23:06:00.000Z-Prince Kassad-2010-12-24T22:38:00.000Z11
Ei der Internet Explorer, der hat mit solchen Symbolen immer große Probleme. Eine richtige Lösung gibt es nicht, man kann wohl irgendwo die Standardschriftart ändern, aber frag mich jetzt nicht, wo, denn das weiß ich nicht. -- Prince Kassad Portal Diskussion:Unicode/Archiv/2010#c-Prince Kassad-2010-12-24T23:14:00.000Z-RonaldH-2010-12-24T23:06:00.000Z11