Portal Diskussion:Unicode/Archiv/2020

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 2 Jahren von Antonsusi in Abschnitt math. Symbole, Fraktur-R Groß
Zur Navigation springen Zur Suche springen

Hatran

Die Schrift heißt nicht "Hatran" sondern schlicht und einfach "Hatra", nach einem der Orte, an dem sie gefunden wurde. Im deutschen Standardwerk (und einzigem Werk) über diese Sprache von Klaus Beyer, vgl. <https://www.uni-heidelberg.de/fakultaeten/philosophie/ori/semitistik/hatra.html> kommt das Wort "Hatran" kein einziges Mal vor. Hatran ist eine englische Adjektivbildung zu Hatra, etwa wie im Deutschen "haträisch". Engl. "Hatran Aramaic" ist deutsch als Hatra-Aramäisch oder haträisches Aramäisch zu übersetzen, aber keinesfalls als "Hatran-Aramäisch". Haträisch ist bei Beyer nicht gebräuchlich. Man sollte also überall in der deutschen Wikipedia Hatran durch Hatra oder Hatra-Schrift ersetzen. Eine Hatran-Schrift gibt es nicht. Das ist ein echter Bock, den das Unicode Konsortium da geschossen hat. Ich hatte sie beim Entwurf der Schrift beraten, aber diese Leute sind oft erstaunlich resistent gegen Einwände. --2001:16B8:24FA:BC01:A084:3DFA:6B34:99E1 09:30, 13. Apr. 2020 (CEST)

Diese Quelle belegt nur, dass der Fundort "Hatra" lautet, aber nicht, dass die Schrift in der Wissenschaft "Hatra" genannt wird. Da bedarf es eines Belegs im Sinne von wiss. Veröffentlichungen, in denen die Schrift so genannt wird. Idealerweise nicht nur von Prof. Dr. Klaus Beyer. ÅñŧóñŜûŝî (Ð) 09:38, 13. Apr. 2020 (CEST)
In den Werken von Beyer taucht das Wort "Hatran" nur im Zitat englischsprachiger Literatur auf ("Hatran Aramaic"). Er selbst spricht von "Hatra-Schrift", siehe etwa "Die aramäischen Inschriften aus Assur, Hatra und dem übrigen Ostmesopotamien (datiert 44 v. Chr. bis 238 n. Chr.): Nachträge" Seite 27, Zeile 10. Auch bei <http://archiv.ub.uni-heidelberg.de/propylaeumdok/1309/1/Roellig_Aramaica_Haburensia_I_2000.pdf> steht auf Seite 380, Zeile 19 "Hatra-Schrift". "Hatran" als Name der Schrift ist eine deutsche Neuschöpfung von Wikipedia, das findet sich sonst nirgends. Aber gut, da Wikipedia normativen Charakter hat, wird die Schrift in einigen Jahren tatsächlich so heißen. --2001:16B8:24FA:BC01:A084:3DFA:6B34:99E1 10:20, 13. Apr. 2020 (CEST)
WP soll und darf nicht normativ sein. Beyer war sicherlich ein Experte auf diesem Gebiet. Es wäre aber trotzdem gut, wenn es noch mind. einen weiteren Wissenschaftler gäbe, der die Bezeichnung "Hatra-Schrift" oder "Hatra script" verwendet (hat). Das dient dem Zweck, keine - wenn auch kompetente - Einzelmeinung zu übernehmen, ohne das deren allg. Akzeptanz belegt ist. ÅñŧóñŜûŝî (Ð) 11:07, 13. Apr. 2020 (CEST)
Die Engländer bilden zu Ortsnamen auf -a Adjektive auf -an: Russia - Russian, Persia - Persian, America - American und deshalb Hatra - Hatran. Wenn jemand "Persian script" als "Persian-Schrift" oder "American food" als "Amerikan-Essen" übersetzen würde, dann wäre das doch peinlich. Genau das tut aber Wikipedia mit ihrer "Hatran-Schrift". Literatur zur Hatra-Schrift ist extrem rar, wie orchideenhaft dieses Untergebiet der Aramaistik ist, macht sich wohl kaum ein Außenstehender klar. Deshalb bin ich mit der Bitte nach weiteren Belegstellen momentan etwas überfordert. Ich melde mich an dieser Stelle, wenn mir noch was einfällt. Schöne Grüße --2001:16B8:24FA:BC01:A084:3DFA:6B34:99E1 11:54, 13. Apr. 2020 (CEST)
Kleiner Nachtrag: Wenn man bei Google "Hatra script" sucht, findet man doch einiges. --2001:16B8:24FA:BC01:A084:3DFA:6B34:99E1 12:06, 13. Apr. 2020 (CEST)
Ich stimme hier der IP voll zu. Die Annahme, deutschsprachige Wissenschaftler würden die englische Wortbildung in deutschsprachige Komposita wie „Hatran-Schrift“ übernehmen, ist Theoriefindung und (bisher) durch keine einzige Fundstelle außerhalb von Wikipedia-Derivaten belegt. Die Bezeichnung "Hatra-Schrift" ergibt sich hingegen einerseits aus den Regeln der deutschen Sprache und hat andererseits mindestens zwei Fundstellen (die hier schon genannten mit der Google-Suche auffindbaren Belege). Solange "Hatran-Schrift" nicht doch noch durch Unicode- und wikipediafremde Belege gestützt wird, hat diese Bezeichnung in der Wikipedia m. E. nichts zu suchen. -- Karl432 (Diskussion) 12:23, 13. Apr. 2020 (CEST)
Es kann auch ein Buch in einer Bibliothek sein. Da muss dann aber ein Wikipedianer mit Zugang zu dieser Bibliothek nachlesen gehen. Der Vergleich mit dem Englischen ist plausibel, aber dann müsste man "Hatran" mit "Haträisch" oder "Haträische Schrift" übersetzen. Es muss auch dargestellt werden, ob zu dieser Schrift auch eine eigene Sprache gehört oder ob das z. B. eine Schrift für Aramäisch bzw. eine Variation von Aramäisch ist. Wenn du da Kenntnisse und Quellverweise hast, dann kannst du unter Hatran-Schrift gerne loslegen. Ein Verschieben nach "Hatra-Schrift", "Haträische Schrift" oder "Haträisch" (letzteres nur, wenn es auch eine separate Sprache ist) ist jederzeit möglich. Sei mutig und schreibe etwas dazu ein lächelnder Smiley  ÅñŧóñŜûŝî (Ð) 12:19, 13. Apr. 2020 (CEST)
P.S.: Wenn du als Autor loslegen willst, wäre eine Anmeldung unter einem Usernamen sinnvoll, weil man dann besser mit dir kommunizieren kann. ein lächelnder Smiley  ÅñŧóñŜûŝî (Ð) 12:24, 13. Apr. 2020 (CEST)
Ich habe jetzt in Unicodeblock Hatran die Schriftbezeichnung von "Hatran-Schrift" auf "Hatra-Schrift" geändert. Der Link dort ist derzeit ein Rotlink und könnte mit einer Übersetzung von en:Hatran alphabet gefüllt werden. Ob der Unicodeblock-Artikel nach "Unicodeblock Hatra", "Unicodeblock Hatra-Schrift" oder "Unicodeblock Haträisch" zu verschieben wäre (letzteres tatsächlich nur, wenn sich ein Beleg für "haträisch" als Bezeichnung für Sprache oder Schrift findet), wäre noch zu diskutieren. -- Karl432 (Diskussion) 12:38, 13. Apr. 2020 (CEST)
Den Begriff "haträisch" hab ich oben auf der Suche nach einem Adjektiv zu Hatra erfunden. Ich habe ihn vorher noch nie gehört oder gelesen. Ich würde ihn deshalb nicht verwenden. Man benutzt als Adjektivbildung stattdessen "Hatra-", also Hatra-Schrift, Hatra-Aramäisch etc. Klaus Beyer liefert on seinem Monumentalwerk "Die aramäischen Texte vom Toten Meer ..." in der Einleitung eine Übersicht über die Entwicklung des Aramäischen. Dabei bezeichnet er auf Seite 46ff. Hatra als den ostmesopotamischen Zweig des Altostaramäischen. Das ist also durchaus ein eigenständiger aramäischer Dialekt und in verschiedenen Merkmalen deutlich unterschieden von den anderen aramäischen Dialekten der Zeit von 44 v.Chr. bis 238 n.Chr. Ich war früher mal als Autor bei Wikipedia tätig, hab das aber frustriert und genervt aufgegeben und werde es nicht mehr beginnen. Dazu braucht man Nerven wie Drahtseile und ich ziehe einen ruhigen Schlaf vor. --2001:16B8:24FA:BC01:A084:3DFA:6B34:99E1 16:01, 13. Apr. 2020 (CEST)
Schade. Als Autor brauchst du die Sicherheit, in der Sache richtig zu liegen (gute Quellen!) und demzufolge gute Argumente und ein gutes Gefühl dafür, wie man damit zuerst die Autoren der "Vielleicht-hat-du-Recht-Fraktion" zur "Du-hast-Recht-Fraktion" herüberzieht und dann gemeinsam die User vom Typ "Du hast auf gar keinen Fall Recht weil ich immer Recht habe" zum Rückzug bewegt. Das gelingt am Besten, wenn man ihnen die Chance bietet, das Gesicht zu wahren. So funktioniert das hier, denn die Wahrheit setzt sich langfristig fast immer durch. Zur Sachfrage: Wenn die in dieser Schrift geschriebene Sprache eher ein Dialekt ist, dann erklärt das auch, warum "haträisch" o. Ä. nicht üblich ist. Das Thema gehört also eher als Abschnitt nach Aramäische Sprache. Unicodeblöcke haben offiziell nur den englischen Namen, egal, wie gut der gewählt wurde. Also ok, wir können ihn also auch Hatra-Schrift nennen. Ich werde es anpassen. ÅñŧóñŜûŝî (Ð) 16:18, 13. Apr. 2020 (CEST)

1. Wolfgang Röllig (2000:380) benutzt den Terminus „Hatra-Schrift“. 2. Eine Änderung betrifft auch zentrale Wikipedia-Einrichtungen wie Modul:ISO15924/translate. Lieben Gruß —LiliCharlie (Disk.) 17:08, 13. Apr. 2020 (CEST)

ISO 15924 ist ein schönes Stichwort: unicode.org
Eine verifizierte deutsche Übersetzung lag bisher nicht vor; somit erstmal englisch.
Mit „Hatra-Schrift“ ließe sich jedoch deutsch leben; wir haben das bei etlichen indigenen Kulturen rund um den Planeten und quer durch die Jahrtausende, wo es absolut keine eingebürgerte deutschsprachige Form gibt, geschweige denn einen Eintrag im Duden.
VG --PerfektesChaos 17:26, 13. Apr. 2020 (CEST)
Off-topic: Hallo PerfektesChaos, könntest du auf der oben von mir genannten Seite Modul:ISO15924/translate den Eintag für Hrkt von japanische Silbenschrift in japanische Silbenschriften ändern, damit es 1. dem englischen Japanese syllabaries entspricht und 2. klar ist, dass es sich bei dieser Zusammenfassung von Hira (Hiragana) und Kana (Katakana) um zwei graphisch deutlich unterschiedene Schriften handelt? Lieben Gruß —LiliCharlie (Disk.) 17:54, 13. Apr. 2020 (CEST)
Muss ich erstmal anfangen zu denken, ggf. erstmal drüber schlafen.
Problem ist die Grammatik; Plural war bisher für deutsch nicht vorgesehen und die Wirkung auf gebeugte Dativ-Genitiv-Geschichten überblicke ich erstmal noch nicht.
„»XY« in japanischen Silbenschriften“ taucht dann vermutlich auch noch auf, oder so.
VG --PerfektesChaos 18:12, 13. Apr. 2020 (CEST)
Enspricht denn der Singular „»XY« in japanische Silbenschrift“ den Gepflogenheiten deutscher Grammatik? Lieben Gruß —LiliCharlie (Disk.) 18:28, 13. Apr. 2020 (CEST)
Da sind möglicherweise mehrere nicht so ganz durchkonjugiert; „»XY« in Hiragana-Schrift“ klappt auch so, siehe Vorlage:HiraS. So auch Vorlage:Bopo und Vorlage:Hant.
Bei denen, deren Grundform auf -isch endete, sind die von mir vermutlich einmalig systematisch mit Grammatik versehen worden; japanische Silbenschrift endet auf -rift, notfalls auf -ische, und fiel dann wohl durchs Raster.
Vorlage:Hebr bekam also ein Löffelchen Grammatik ab.
VG --PerfektesChaos 19:05, 13. Apr. 2020 (CEST)
Meine Frage war doppelbödig. Selbstverständlich entspricht „»XY« in japanische Silbenschrift“ den Gepflogenheiten deutscher Grammatik, etwa im Ausdruck „»XY« in japanische Silbenschrift übertragen“, wo „übertragen in“ ein Ausdruck ist, der den Akkusativ regiert. Lieben Gruß —LiliCharlie (Disk.) 19:15, 13. Apr. 2020 (CEST)
Bitte nicht abschweifen. ein SmileysymbolVorlage:Smiley/Wartung/;-)  Bitte das Modul ggf. anpassen. Ansonsten ist das Thema m. E. wohl erledigt. ÅñŧóñŜûŝî (Ð) 23:06, 13. Apr. 2020 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: ÅñŧóñŜûŝî (Ð) 23:06, 13. Apr. 2020 (CEST)

Wie sinnvoll ist die Angabe des Unicodeblockes in Zeichentabellen?

In Zeichentabellen wie beispielsweise in Pluszeichen#Varianten des Pluszeichens werden zu jedem Unicode-Zeichen häufig auch die Unicode-Blöcke mit tabelliert. Ist diese Version wirklich notwendig? Meiner Ansicht nach werden die Tabellen hier nur mit Information ohne praktischen Nutzen für den Anwender unnötig aufgeblasen. Es gibt zwar Software, in der sich ein Sonderzeichen über eine Liste der Blöcke auswählen lässt (z.B. Micosoft Word, Funktion "Einfügen" – "Symbol", aber wer die Tabelle vor sich hat, fügt das Symbol über Copy/Paste aus der Zeichen-Spalte in seinen Text ein. Ich experimentiere auf Durchmesserzeichen#Darstellung in Computersystemen gerade, wie eine solche Tabelle mit moglichst hohem Nutzerwert aussehen könnte, und habe dort gerade die Spalte "Unicode-Block" gelöscht. -- Karl432 (Diskussion) 11:24, 7. Mär. 2020 (CET)

Der Block ist wichtig, weil er Informationen über den Kontext, in dem ein Zeichen steht, liefert. Vom Aussehen her kämen als Durchmesserzeichen U+00D8, U+00F8, U+2205, U+2298 und U+2300 in Frage. Der Blockname "Latin-1 Supplement" verrät hier z. B., dass U+00D8 und U+00F8 keine Durchmessersymbole, sondern Variationen vom Buchstaben O sind, also keineswegs einen Kreis darstellen müssen. Desweiteren verrät dir der Blockname "Mathematical Operators", dass U+2205 das Symbol für die leere Menge ist und daher eine durchgestrichene Null darstellt. der gleiche Blockname verrät, dass auch U+2298 ein Operator / mathem. Symbol ist. Der Blockname "Miscellaneous Technical" verrät dir, zusammen mit dem Namen "DIAMETER SIGN", dass nur U+2300 per Definition das eigentliche Durchmesserzeichen ist. Es ist - wie der Blockname (!) verrät - ein technisches Zeichen und kein mathematisches. Nur bei diesem Codepoint sind Fonthersteller gehalten, einen diagonal durchgestrichenen Kreis als Glyphe zu nehmen. Alle anderen können wie ein O oder eine Null geformt sein. Ich lege dir nahe, die Blocknamen nicht wergzulassen. ÅñŧóñŜûŝî (Ð) 14:14, 7. Mär. 2020 (CET)

Von den Unicode-Eigenschaften eines Zeichens halte ich in diesem Kontext Script für sehr viel nützlicher als Block, denn die Zuweisung zu Blöcken unterliegt zahlreichen Umständen, die mehr die Geschichte der Norm widerspiegeln als die grammatologische Klassifikation. Ziemlich hilfreich scheinen mir auch Name, Name_Alias und General_Category. Lieben Gruß —LiliCharlie (Disk.) 14:57, 7. Mär. 2020 (CET)
P.S.: Nur um nicht missverstanden zu werden: Block halte ich auch für nützlich, nur sind viele Schriftsysteme auf verschiedene Blöcke verteilt. Lieben Gruß —LiliCharlie (Disk.) 15:09, 7. Mär. 2020 (CET)
Bei Schriftzeichen ist Script gewiss sehr wichtig. Hier ging es aber um die Unterscheidung zwischen Schriftzeichen und Symbol und Symbole gehören nicht zu einem Script. Gerade das Durchmesserzeichen ist so ein Beispiel, weil das wegen der Verbreitung in Fonts oft verwendete Zeichen U+00F8 eigentlich ein Buchstabe ist. ÅñŧóñŜûŝî (Ð) 16:43, 7. Mär. 2020 (CET)
Ich halte den Namen des Unicodeblocks trotzdem für nicht sehr aussagekräftig. Dass sich U+2318 PLACE OF INTEREST SIGN, U+231A WATCH, U+23F0 ALARM CLOCK oder U+23F3 HOURGLASS WITH FLOWING SAND im selben Block MISCELLANEOUS TECHNICAL wie U+2300 DIAMETER SIGN befinden, kann eher in die Irre führen als zum Ziel. Und wer in diesem Block sucht, findet technische Zeichen wie U+2126 OHM SIGN, U+299F ACUTE ANGLE, U+2BD0 SQUARE POSITION INDICATOR und sehr viele andere nicht. Lieben Gruß —LiliCharlie (Disk.) 17:13, 7. Mär. 2020 (CET)
Ich sehe die Namen der Unicodeblocks ähnlich wie LiliCharlie. Was ich letztendlich machen möchte, ist eine auf Vorlagen basierte Zeichentabellenstruktur, die ohne großen Aufwand in andere Zeichenartikel integriert werden kann und dort eine gewisse Einheitlichkeit herstellt. Wie das aussehen könnte, zeigt die zweite Tabelle im zwischenzeitlich angelegten Benutzer:Karl432/Zeichentabellentest1. Speziell habe ich dort für jedes Unicode-Zeichen automatisch einen Link auf decodeunicode.org generiert, in dem man alles bisher Genannte findet (Block, Script, Category) und viel mehr findet. Wir müssen hier das Rad nicht neu erfinden, und wer an diesen Einzelheiten interessiert ist, wird auch die englische Sprache auf der Seite nicht unbedingt als Hindernis empfinden. Ich weiß natürlich, dass Weblinks eigentlich nicht im eigentlichen Artikeltext eingefügt werden sollten; ich werde dies auf WP:Fragen zur Wikipedia thematisieren. -- Karl432 (Diskussion) 23:42, 7. Mär. 2020 (CET)

Ihr macht hier Doppel-Posting in zwei Strängen; ich habe mich soeben auf WP:FZW# Vorlage mit externem Link zur Verwendung in Zeichentabellen ausführlich in dieser Angelegenheit geäußert.

VG --PerfektesChaos 13:06, 8. Mär. 2020 (CET)

Vielen Dank für die ausführlichen Rückmeldungen. Wie auf WP:FZW# Vorlage mit externem Link zur Verwendung in Zeichentabellen begründet, nehme ich den externen Link auf decodeunicode.org bei der Weiterentwicklung meiner Vorlagen wieder heraus. (Anmerkung: Die Demo-Benutzerseite zu meiner Frage habe ich verschoben und eingefroren, damit diese Diskussion auch im Archiv verständlich bleibt. Der Link in meinem Beitrag vom 7. März 2020 23:42 ist angepasst). Zunächst lasse ich die zusätzlichen Informationen wie Block oder Script in meinen Vorlagen ganz weg; später kann man z. B. eine Verlinkung von dem Codepunkt auf den zutreffenden Schriftsystem-Artikel (oder Unicodeblock-Artikel, oder was auch immer) basteln. Das ist ja einer der Vorteile von Vorlagen, dass man dies dann an einer Stelle zentral machen kann. -- Karl432 (Diskussion) 13:42, 8. Mär. 2020 (CET)

Die Diskussion auf Wikipedia:Fragen zur Wikipedia# Vorlage mit externem Link zur Verwendung in Zeichentabellen velief so:

„Im Moment versuche ich gerade, eine allgemein verwendbare Tabellenstruktur für die Abschnitte „Darstellung in Computersystemen“ in Zeichenartikeln zu entwerfen, Beispiel Durchmesserzeichen. In Benutzer:Karl432/Zeichentabellentest1 ist in der zweiten Tabelle der aktuelle Stand meiner Entwicklung zu sehen, siehe auch Portal Diskussion:Unicode#Wie sinnvoll ist die Angabe des Unicodeblockes in Zeichentabellen?.
Meine Frage dazu: Um nicht in der Wikipedia das Rad neu zu erfinden und irgendwelche Lua-Skripte zu entwickeln, um beispielsweise für jedes Unicode-Zeichen auf den entsprechenden Unicodeblock zu verweisen, generieren meine dort genannten Vorlagen-Entwürfe für jedes Unicodezeichen einen Link auf decodeunicode.org, wo sich die (algorithmisch aus den Unicode-Daten abgeleiteten Daten) für jedes Zeichen finden lässt (zumindest aktuell bis Unicode Version 11). Darf eine solche Vorlage im ANR verwendet werden, trotz der Aussage auf WP:Weblinks „Weiterführende Weblinks werden nicht im eigentlichen Artikeltext eingefügt“? -- Karl432 (Diskussion) 00:03, 8. Mär. 2020 (CET)

Ist das verlinkte Projekt decodeunicode abhängig vom Überleben der Hochschule Mainz und ihres Departments of Communication Design? Wer finanziert es und hat die Macht es einzustellen? Lieben Gruß —LiliCharlie (Disk.) 07:11, 8. Mär. 2020 (CET)
Ich stimme dem Vorredner insbesondere dahingehend zu, dass es nicht die Art unserer Konservierung des Wissens ist, eine derartige Information an eine externe Website zu delegieren, womöglich eine bei uns schon vorhandene Information aus unserem Artikel herauszulöschen und an eine wildfremde Website zu delegieren, die das Angebot vielleicht in vier Jahren eingestellt haben wird.
Die Info ist einigermaßen trivial und nicht sehr aufwändig; das können wir problemlos selbst verwalten.
  • Es gibt um die 100 in Frage kommende Blöcke, die sich aus der Nummer des Zeichens ableiten lassen.
  • Jedes Zeichen steht in einer Range, einem zusammenhängenden Bereich von 20, 100, 200, 2000, 10000 Zeichen, die den fraglichen Block bilden.
  • Es braucht also nur eine Umrechnung, um für die in der Infobox oder sonstwo gegebenen Zeichen-Nummer („codepoint“) herauszufinden, in welchem Bereich diese Nummer liegt und welcher Unicode-Block diesem Bereich zuzuordnen ist.
  • Ein sehr ähnliches Procedere, das zu jeder Zeichen-Nummer den Script-Code gemäß ISO 15924 effizient ermittelt, haben wir schon.
    • Es ist global für alle Wikis hinterlegt auf commons:Data:ISO15924/unicodes.tab.
    • Eine sehr ähnliche Zuordnung, die die englischen Namen der Unicodeblöcke dem jeweiligen Range (oder gelegentlich Ranges) und damit jedem einzelnen Zeichen zuordnet, mag gern ein gelangweilter Lua-Programmierer schreiben; ersatzweise einer Item-Nummer auf Wikidata oder optimal beidem.
    • Danach bedarf es nur noch einer analogen Tabelle, die den englischen Namen des Unicode-Blocks unserem hiesigen Artikel zuordnet, oder noch schlichter und global verwendbar aus der Item-Nummer auf Wikidata zuordnet, welchen Namen unser Artikel über diesen Unicode-Block hat.
    • Das Script lässt sich per showScripts@ISO15924 ermitteln und muss perspektivisch nicht als Vorlagenparameter gesetzt werden; ich nehme mal Ω, das griechische Omega U+03A9: 3A9-Ω-Grek
    • Die schon vorhandene Liste wird seit Jahren permanent produktiv bei uns eingesetzt; Kategorie:Wikipedia:Vorlagenfehler/Vorlage:lang/Zwiebelfisch meckert über alle unerlaubt gemischten Verwendungen in der lang-Vorlage.
VG --PerfektesChaos 13:03, 8. Mär. 2020 (CET)

Vielen Dank für die ausführlichen Rückmeldungen. Wenn der Weg, solche Information wikipedia-intern zu verwalten, ohnehin schon eingeschlagen ist, ist es sicher richtig, dabei zu bleiben. Ich nehme den externen Link auf decodeunicode.org bei der Weiterentwicklung meiner Vorlagen wieder heraus. (Anmerkung: Die Demo-Benutzerseite zu meiner Frage habe ich verschoben und eingefroren, damit diese Diskussion auch im Archiv verständlich bleibt. Der Link in meinem Fragetext ist angepasst). -- Karl432 (Diskussion) 13:32, 8. Mär. 2020 (CET)“


Wie und aufgrund welcher Quelle wird denn derzeit die deutschsprachige „Bezeichnung / Beschreibung“ generiert? Lieben Gruß —LiliCharlie (Disk.) 19:51, 8. Mär. 2020 (CET)

Der Spaltentext dafür wird an die Zeilenvorlage in jedem Fall als Pflichtparameter „text“ übergeben, ist also freier Text ohne jegliche Automatik (der z. B. auch ref-tags für Einzelnachweise enthalten kann). Quellen für eine Bezeichnung können der allgemeine Sprachgebrauch, fachsprachliche Quellen (z. B. für mathematische Zeichen) oder auch Normen wie die DIN 5008 sein. Auch die Auflistung des Zeichens im jeweiligen Unicodeblock-Artikel kann in Frage kommen. Statt als eine (möglicherweise unbelegte) Bezeichnung kann der Feldinhalt auch als Beschreibung gelesen werden und ist damit gegen WP:Begriffsfindung immun (beispielsweise der „eingekreiste Geteiltstrich“ in der letzten Zeile meiner Beispieltabelle), deshalb die Spaltenüberschrift.
(Zu meinem aktuellen Entwicklungsstand, solange noch nichts im ANR verfügbar ist, siehe weiterhin Benutzer:Karl432/Tabellentest.) -- Karl432 (Diskussion) 20:34, 8. Mär. 2020 (CET)
Ich möchte vorschlagen, die Autoren/Copyright-Inhaber von https://unicode-table.com/de/ darum zu bitten, uns (bzw. der Wikimedia Foundation) unter einer für beide Seiten günstigen Lizenz zu erlauben, ihre Zeichennamen hier zu verwenden und uns jetzt sowie bei Updates eine algorithmisch auslesbare Datei zur Verfügung zu stellen, die diese eindeutigen Namen Unicode-Codepoints zuordnet. Desweiteren schlage ich vor, Redirects von den dort benutzten Bezeichnungen auf unsere einschlägigen Artikel anzulegen. Lieben Gruß —LiliCharlie (Disk.) 21:07, 8. Mär. 2020 (CET)
Schaden tut das natürlich nichts, das ist mit Sicherheit ein sehr lobenswertes Projekt, aber es ist anscheinend eine private Internetseite (die lila Farbgebung und der zwar auch lobenswerte, aber fachfremde Hinweis auf den Internationalen Frauentag lassen mich dies vermuten; mir ist es nicht gelungen, mit der aktuellen Firefox-Version das Impressum herauszukitzeln). Für decodeunicode.org ist im Vergleich dazu jedenfalls ein universitärer Hintergrund belegt. Im Zweifelsfall haben Zeichenbezeichnungen aus deutschsprachiger Fachliteratur und deutschsprachigen Normen sicher Vorrang. -- Karl432 (Diskussion) 21:23, 8. Mär. 2020 (CET)
Ja, natürlich. Vielleicht liegt es nur an meinen anglophon-zentrierten Browsereinstellungen, aber: Hat decodeunicode.org überhaupt deutschsprachige Zeichen-Bezeichner? Lieben Gruß —LiliCharlie (Disk.) 21:32, 8. Mär. 2020 (CET)
Anscheinend wohl nicht, insofern hat mein Vergleich nicht gepasst. -- Karl432 (Diskussion) 21:42, 8. Mär. 2020 (CET)
Dann möchte ich vorschlagen, dass wir zwar per default die unicode-table.com/de/-Namen benutzen, uns aber vorbehalten, in (z. B. durch die deutschsprachige Fachliteratur) begründeten Fällen davon abzuweichen. Lieben Gruß —LiliCharlie (Disk.) 22:09, 8. Mär. 2020 (CET)
Davon bin ich nicht wirklich begeistert (siehe auch die Anmerkungen von PerfektesChaos dazu unten). Ich würde für die Spalte „Bezeichnung/Beschreibung“ überhaupt keine Vorgaben machen wollen und deren Inhalt in die Verantwortung der jeweiligen Artikelbearbeiter stellen wollen. -- Karl432 (Diskussion) 00:47, 9. Mär. 2020 (CET)

Ich kann euch nicht so restlos folgen, aber zu den aufgeworfenen Fragen:

  • http://www.unicode.org/copyright.html
    • 2. Any person is hereby authorized, without fee, to view, use, reproduce, and distribute all documents and files, subject to the Terms and Conditions herein.
    • 7. No license is granted to “mirror” the Unicode website where a fee is charged for access to the “mirror” site.
  • Es gibt keine „offizielle deutsche Übersetzung“ von irgendwas. Es gibt keinen „offiziellen deutschen“ mit irgendeiner Zuständigkeit.
    • https://unicode-table.com/de/ ist auch nur ein kommerzieller Leute-auf-seine-Website-Locker.
    • This site is not in any way associated with or endorsed or sponsored by Unicode, Inc. (aka The Unicode Consortium).
  • Das, was wir machen, hat alles keine Schöpfungshöhe und wäre gemeinfrei.
    • Zwar genießen Zusammenstellungen ganzer Datenbank Schutzrechte, aber wir geben es nicht als unsere eigene Erfindung aus und reproduzieren nur mit Herkunftsnachweis, und das ist ausdrücklich erlaubt.
    • An einem „Lateinischen Kleinbuchstaben a“ ist nichts copyrightbehaftetes, und es braucht auch keinen vereidigten Übersetzer zu.
  • Alle Namen
  • 318 PDF (öfters mehrere PDF für einen Block?)

VG --PerfektesChaos 22:38, 8. Mär. 2020 (CET)

@Karl432: Für deine Vorlagenprogrammiererei – {{#invoke:ISO15924|showScript|Ω}} – VG --PerfektesChaos 22:47, 8. Mär. 2020 (CET)
Danke für den Tipp. Bei meiner Vorlage habe ich zunächst vor, eine Spalte für Apple-Tastatureingabe (also iOS und macOS) einzubauen und möglicherweise zu automatisieren, außerdem die Spalte Dezimalcode komplett gemäß DIN 5008 zu automatisteren (das wäre mein Einstieg in die Lua-Programmierung), und diverse Sonderfälle zu automatisieren (beispielsweise in der Spalte „Zeichen“ diakritische Zeichen unicodemäßig auf gepunktetem Kreis darzustellen). Es wird also ohnehin noch dauern, bis ich das für den ANR zur Verfügung stelle. Vielleicht mache ich dann auch etwas für Unicode-Blöcke (siehe meine Idee unten). -- Karl432 (Diskussion) 00:47, 9. Mär. 2020 (CET)
(Nachtrag zu meinen genannten Plänen: Von dem Vorhaben einer Spalte für Apple-Tastatureingaben bin ich mittlerweile abgekommen, nachdem die dort mit Alt-Taste eingebbaren Sonderzeichen offensichtlich nicht in allen macOS-Versionen bzw. -Anwendungssoftware gleich sind.) -- Karl432 (Diskussion) 09:48, 9. Mär. 2020 (CET)

Zu den Unicodeblöcken habe ich folgende Idee: Falls ich mich mal in der Rolle eines „gelangweilten Lua-Programmierers“ sehe, könnte ich die oben genannte Idee von PerfektesChaos verfolgen, eine Funktion zu erstellen, die zu einem Codepunkt den offiziellen vom Unicode-Konsortium festgelegten englischen und stabilen Blocknamen liefert. Dann wäre in der deutschsprachigen Wikipedia für jeden Block eine Weiterleitung von „Unicodeblock <englischer Blockname>“ auf „Unicodeblock <deutscher Blockname>“ anzulegen. Dies hat (abgesehen von der Verwendbarkeit einer solchen Funktion auch in anderssprachigen Wikipedien) den Vorteil, dass die ja nicht standardisierten und deshalb jederzeit änderbaren „deutschen Blocknamen“ nicht noch an einer weiteren Stelle verwaltet werden müssten, und man bei einer Änderung der deutschen Blocknamen (z. B. bei einer Anpassung an die in MS Word verwendeten Namen) nur die (per „Links auf diese Seite“ direkt auffindbare) Weiterleitung ändern müsste. (Oder geht dies mit Wikidata eleganter ohne solche Weiterleitungen – dazu bräuchte ich Info, mit Wikidata habe ich mich außer Interwikilinks noch gar nicht befasst.) Was ist von dieser Idee zu halten? -- Karl432 (Diskussion) 00:47, 9. Mär. 2020 (CET)

Eine andere technische Frage (also speziell an @PerfektesChaos:): Wenn man in einem Artikel eine längere Zeichentabelle hat (mit im Extremfall über 100 Zeilen), und in jeder Zeile für mehrere Spalten einen Lua-Automatismus der Sorte hat „gebe mir zu dem Zeichencode eine Eigenschaft wie Block oder Schriftsystem oder macOS-Tastatureingabe“, kann man dan in Performanceprobleme oder sonstige Beschränkungen kommen? (Meine Idee ist es, dann in der Zeilenvorlage Parameter für Vorbesetzung solcher Werte zu bieten, sodass die Lua-Funktion dann nur bei Nichtvorgabe dieses Parameters aufgerufen wird.) -- Karl432 (Diskussion) 00:47, 9. Mär. 2020 (CET)

  • @Tabelle der Block-Namen:
    • Das war von mir schon ernstgemeint gewesen.
    • Die Abbildung auf die lokalen Namen der Artikel gibt es schon längst; die steht auf Wikidata.
    • Mit der Wikidata-Q-Nummer ist ohne weitere Abbildungsmaßnahmen global für jedes Wiki zu ermitteln, ob es überhaupt einen lokalen Artikel gibt, wie der heißt, oder ersatzweise wie der Artikel in der enWP hieße, auf den ein fremdes Wiki dann auch verlinken könnte.
    • Die globale Tabelle hieße dann Unicode/block.tab und hätte drei Felder:
      • string, englischer Standard-Name des Blocks
      • string, Ranges wie oben im Vergleichsfall
      • number, Q-Nummer auf Wikidata
    • Der englische Name des Blocks dient nur zur Sicherheit, wenn die Q-Nummer mal durcheinanderkommt, und ist direkt mit den Ranges vergleichbar. Umgekehrt lässt sich der englische Klarname direkt mit den Q-Nummern vergleichen.
  • @Performance
    • Kann schon sein; ohne Kenntnis der Umstände nicht zu sagen. Mag eng werden.
    • Man würde aber anders vorgehen; wenn man schon so eine Tabelle hat mit 128 Zeichen oder sowas, dann würde man intelligenterweise nur einmalig ein Lua-Modul aufrufen, diesem das übergeben was auf der Seite benötigt wird und das Lua-Modul generiert die gesamte Tabelle auf einmal.
    • Wenn für jedes einzelne Zeichen viermal ein Lua-Modul aufgerufen wird, dann kostet das. Wenn es für die ganze Tabelle einmal mit 150 Parametern aufgerufen wird, dann wird das intern effizient durchgearbeitet; das passt schon.
VG --PerfektesChaos 01:04, 9. Mär. 2020 (CET)

Ich habe die Vorlagen Vorlage:ZeichentabelleKopf, Vorlage:Zzeile und Vorlage:ZeichentabelleEnde jetzt scharfgeschaltet, siehe Benutzer:Karl432/Tabellentest und Durchmesserzeichen. Der Unicodeblock ist jetzt mit dem Codepunkt verlinkt und somit für Interessenten leicht auffindbar (siehe Hinweis im Spaltenkopftext), ohne die Tabelle aufzublasen. Das für die automatische Zuordnung entwickelte Lua-Skript "Unicodeblocklemma" in Modul:Unicodezeichen ist sicher krude, aber funktioniert (und wer will, kann es ja verbessern). Das Schriftsystem ist ja normalerweise im Unicodeblock-Artikel verlinkt und somit auch leicht aufzufinden. -- Karl432 (Diskussion) 19:08, 12. Mär. 2020 (CET)

Du bist da vorlagentechnisch auf dem Holzweg.
Insbesondere eine Vorlage:Zzeile ist für das Gesamtprojekt so nicht tragbar.
Wenn, dann heißen die drei Vorlagen:
  • Vorlage:Zeichentab/Kopf
  • Vorlage:Zeichentab
  • Vorlage:Zeichentab/Ende
Ich sehe aber ohnehin nicht, dass es diese drei Vorlagen noch braucht, da du jetzt mit Lua begonnen hast.
Es genügt ein einziger Modul-Aufruf.
Die vielen einzelnen Aufrufe von Zzeile sind ineffizient.
Das müsste sich mit einem eizigen Lua-Aufruf für die gesamte Tabelle realisieren lassen.
Dein Lua-Modul ist ein netter Versuch, aber es ist noch ganz ganz ganz weit weg von dem, was wir auf Jahre hier produktiv im Projekt pflegen können.
So ist das noch gar nichts, und es ist noch extrem ineffizient und nicht wartungsfähig.
Da musst du noch sehr viel dran machen, bevor das in den echten ANR darf.
VG --PerfektesChaos 19:17, 12. Mär. 2020 (CET)
@Karl432: Bitte stelle deine Ersetzungsarbeiten in den Bestandsartiekln unverzüglich ein.
Dein Modul ist noch lange nicht fertig.
Das Modul ist noch nicht dazu geeignet, um auf Jahrzehnte produktiv im ANR benutzt zu werden.
Es ist nicht wartungs- und pflegefähig.
Du hast erst heute nachmittag in der LWS von mir gelernt, wie man ein Modul aus einer Wiki-Seite heraus aufruft. Du hast schlicht noch nict die Erfahrung, um sowas in den ANR zu bringen.
VG --PerfektesChaos 20:06, 12. Mär. 2020 (CET)
@PerfektesChaos:: Ich kann Deine Perfektionswünsche durchaus nachvollziehen, ich bin schließlich selbst Informatiker und habe schon das eine oder andere Projekt verantwortet. Andererseits arbeiten wir hier an der Wikipedia, und da ist vieles nicht perfekt, sondern die Wikipedia lebt vom Mitmachen und ist ohnehin an vielen Punkten verbesserungsfähig (ich arbeite ja auch daran und halte mich dabei an WP:Sei mutig). Ich kann mir leider auch die Anmerkung nicht verkneifen, dass ich Deine Formulierungen manchmal so leicht oberlehrerhaft empfinde („Du hast schlicht noch nicht die Erfahrung …“), und bitte Dich, auf der Sachebene zu bleiben, was Dir bei Deiner Sachkompetenz sicher leicht fallen kann. Ich kann Dir beispielsweise folgen, wenn Du die drei Vorlagen lieber "Zeichentab/Kopf", "Zeichentab", "Zeichentab/Ende" benannt hättest, aber nicht, weil diese „für das Gesamtprojekt so nicht tragbar sind“ (die Nichttragbarkeit hätte ich gerne begründet), sondern weil ich es einfach als eleganter empfinde (also “nice to have”, aber keine für mich im Moment sichtbare zwingende Notwendigkeit).
Und, für mich sind die Vorlagen fertig, und das Modul Modul:Unicodezeichen ist für meine Zwecke auch fertig (bis auf die Doku, die kommt noch), aber kann von jedem Wikipedianer verbessert werden (so funktioniert Wikipedia letztendlich). Und wieso das „nicht wartungs- und pflegefähig“ sein soll (auf Wikipedia-Niveau, nicht auf dem Niveau von Flugzeugbau-Software), erschließt sich mir nicht, aber ich lausche Deinen Erläuterungen und lerne gerne dazu. Allerdings bist Du zwar hier sicher einer der Hauptkompetenzträger, aber nicht der verantwortliche Abteilungsleiter. -- Karl432 (Diskussion) 21:08, 12. Mär. 2020 (CET)
Die Vorlagen habe ich jetzt auf die von Benutzer:PerfektesChaos vorgeschlagenen Namen verschoben, sie heißen jetzt also Vorlage:Zeichentab/Kopf, Vorlage:Zeichentab und Vorlage:Zeichentab/Ende. -- Karl432 (Diskussion) 22:18, 12. Mär. 2020 (CET)
Ja, danke bis dahin; das macht es für zukünftige Pfleger auf Anhieb erkennbar, dass es sich um Komponenten derselben Angelegenheit handelt, und es lässt sich in einer Liste eingebundener oder sonstwo aufschlagender Namen sofort erkennen, was zusammengehört.
Andernfalls wären es voneinander unabhängig verwendbare Vorlagen; was nicht stimmt und was in der Vergangenheit regelmäßig versemmelt wurde, und für Hinzukommende schwer zu überschauen ist. Wir haben mittlerweile 70.000 Vorlagen und keine 500 mehr.
Zum Thema Lua werde ich mich morgen oder am Wochenende näher äußern.
VG --PerfektesChaos 22:39, 12. Mär. 2020 (CET)

Unicodeblockname „Baltisch“

@Antonsusi:, zunächst einmal vielen Dank, dass Du die Liste der Unicodeblöcke nach Erscheinen der Unicode-Version 13.0 aktualisiert hast. Dabei hast Du allerdings diese Änderung von mir überschrieben. Dort hatte ich den geplanten Blocknamen „Baltisch“ zu „Schrift der Balti“ geändert, mit der Begründung „engl. "balti" ist mit "Baltisch" sicher nicht korrekt übersetzt, die Schrift hat mit dem Ostseeraum nichts zu tun, sondern mit Balti (Sprache) aus Pakistan. In diesem Artikel wird die Schrift als "Schrift der Balti" bezeichnet“. Ich denke mal, Du hast den aktuellen Listentext aus einer Datenbank komplett neu generiert, sodass Dir meine Änderung dabei entgangen war. Deshalb: Können wir hier einen Konsens herstellen, dass die Bezeichnung „Baltisch“ für den geplanten Block wegen der im Deutschen anderen Bedeutung von baltisch nicht zweckmäßig ist, sondern wir stattdessen „Schrift der Balti“ oder „Balti-Schrift“ verwenden? -- Karl432 (Diskussion) 11:17, 13. Mär. 2020 (CET)

„Schrift der Balti“ ist auch nicht gerade ideal, denn bei Unicode sind zwei Balti-Schriften im Gespräch, „Balti A“ und „Balti B“. Auf Liste der Unicodeblöcke wird nur das Dokument aus 1999 verlinkt, es kursiert aber ein Dokument aus 2010, das sich auf dieses bezieht und es ergänzt. Lieben Gruß —LiliCharlie (Disk.) 17:01, 13. Mär. 2020 (CET)
Habe gerade auf der Unicode-Roadmap-Seite nachgesehen, dort sind auch keine neueren Dokumente verlinkt. Dann sieht es wohl so aus, dass daran im Moment nicht gearbeitet wird und die Blöcke kurzfrisitig nicht gefüllt werden. Speziell sind die Blocknamen nicht stabil festgelegt, Debatten über den Schriftnamen sind in Unicode ja üblich. Wir könnten im Moment "Balti-A-Schrift" und "Balti-B-Schrift" schreiben, verlinkte Wikipedia-Artikel zu den Unicodeblöcken gibt es ja sowieso noch nicht. Sobald sich in der Unicode-Roadmap etwas ändert, werden wir es ohnehin nachziehen, bis auf Unicode-Seite Stabilität gegeben ist (d. h. bis ein Schrift-Proposal formal angenommen ist). -- Karl432 (Diskussion) 17:54, 13. Mär. 2020 (CET)
War keine Absicht. Aus meiner Sicht kein Problem, wenn du das nochmal nachträgst. Evtl. nochmal recherchieren, welche Schrift wirklich gemeint ist. ÅñŧóñŜûŝî (Ð) 17:55, 13. Mär. 2020 (CET)
Gemeint ist wohl eine ausgestorbene Schrift für Balti (Sprache). ÅñŧóñŜûŝî (Ð) 18:00, 13. Mär. 2020 (CET)
Da war ohnehin schon jemand anders schneller. So, wie es jetzt da steht ("Balti" und "Balti-B") stimmt es auch mit der Unicode-roadmap überein, und ich denke, wir können das so stehen lassen. -- Karl432 (Diskussion) 18:06, 13. Mär. 2020 (CET)
Ob dieser andere Bearbeiter wohl das Preliminary Proposal to Encode the Balti ‘B’ Script in ISO/IEC 10646 aus dem Jahr 2011 im Kopf hatte? (Der Autor des Balti-B-Proposals ist derjenige, der 2010 auf die Existenz einer zweiten Balti-Schrift hingewiesen hat.) Lieben Gruß —LiliCharlie (Disk.) 18:31, 13. Mär. 2020 (CET)
P.S.: Ich will den von mir verehrten Rick McGowan und Michael Everson wirklich keine bewusste Parteinahme unterstellen, aber vielleicht ist es kein Zufall, dass sie auf der von ihnen verantworteten Unicode-Roadmap-Seite nur ihr eigenes Proposal verlinkt haben. Lieben Gruß —LiliCharlie (Disk.) 18:44, 13. Mär. 2020 (CET)
Ich denke, da gibt es bisher nichts anderes, zumindest auf der Unicode-Seite lassen sich keine anderen Dokumente finden (zum Suchwort „Balti“ nur einzelne Proposals, die die Schreibung der Balti-Sprache in arabischer oder tibetischer Schrift betreffen). Das Dokument N2042 von 1999 (von Rick Gowan unter Mitwirkung von Michael Everson) ist eine einfache Aufzählung einiger Schriften, deren Codierungen möglicherweise in Erwägung zu ziehen seien, ohne detailliert auf die einzelnen Schriftarten einzugehen. Das Dokument N3842 von 2011 (von Anshuman Pandey) beschreibt Balti-B als Erfindung einer einzelnen Person, die in einem einzigen sechs Blätter umfassenden Werk verwendet wurde. Zu Balti-A steht in diesem Dokument: “It is unknown how much literature is available in the old Baltiscript, or what the level of scholarly interest in it is.” – auf deutsch: Vor Ort interessiert sich auch niemand dafür. Das sieht insgesamt eher danach aus, dass die reservierten Blöcke Karteileichen sind, zumal die Balti früher die tibetische und heute die arabische Schrift verwenden und somit unicodemäßig voll versorgt sind. -- Karl432 (Diskussion) 11:52, 14. Mär. 2020 (CET)
Nun, ich persönlich bin, was es die Seriosität von Michael Everson angeht, auch vorsichtig. Es ist auch nicht alles, was er in Sachen Unicode und Fonts veröffentlicht, von hoher Qualität. Sein Font "Everson Mono" ist z. B. nicht wirklich monospace, denn längere Zeilen haben bei gleicher Zeichenzahl abweichende Längen der Darstellung. Es kann also auch schlichtweg ein Fehler von ihm sein, wenn er etwas nicht erwähnt (AGF). Ich würde den Block schlichtweg Balti nennen, denn Balti steht im dt. Sprachraum offensichtlich für Volk, Sprache und auch Schrift(en). ÅñŧóñŜûŝî (Ð) 10:58, 14. Mär. 2020 (CET)
+1. -- Karl432 (Diskussion) 12:00, 14. Mär. 2020 (CET)
Wie oben beschrieben: Rick Gowans N2042 von 1999 hatte gar nicht die Absicht, ein Proposal zu sein, und Anshuman Pandeys N3842 von 2011 ist auch nur eine “introduction”. Es gibt für keine der Balti-Schriften ein formales Proposal, nicht einmal ein “preliminary”. -- Karl432 (Diskussion) 12:00, 14. Mär. 2020 (CET)
Ich habe per Kontaktformular an unicode.org den Wunsch, die Roadmaps zu aktualisieren, geäußert. Da Michael Everson zu den Autoren der Roadmaps zählt, wird sich ggf. zeigen, ob er seriös handelt. ÅñŧóñŜûŝî (Ð) 12:14, 14. Mär. 2020 (CET)

Artikel "Liste der Unicodeblöcke": Änderungsvorschläge

Von Diskussion:Liste der Unicodeblöcke hierher verschoben. --Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 16:22, 23. Apr. 2020 (CEST)

Ich möchte zwei Änderungen der Tabellen vorschlagen:

  1. In der Liste der Ebenen sollten die Abkürzung und Klarnamen der beiden letzten Ebenen eindeutig sein. Über offizielle Abkürzungen und Klarnamen verfügen diese Ebenen soweit ich weiß nicht, insofern sind die jetzigen Angaben, die zudem das BMP-PUA mit einzuschließen scheinen, schwer zu verteidigen. Andererseits sind die Ebenen deckungsgleich mit Blöcken – sie enthalten exakt dieselben 216 Codepoints. Es läst sich verlustfrei deren Namen übernehmen, vielleicht noch ergänzt um eine Abkürzung nur für die Ebene. Gehandhabt wird das so in der Tabelle Unicode Planes in Andrew Wests BabelPad, nämlich: PUA-A (Supplementary Private Use Area-A) und PUA-B (Supplementary Private Use Area-B). Ich bin dafür, dass wir dieses Vorgehen übernehmen.
  2. In der Liste der Blöcke führen wir eine Spalte Schreibrichtung. Schreibrichtungen werden nach dem Bidi-Algorithmus jedoch nicht Blöcken zugewiesen (und dann etwa auf die dort enthaltenen Zeichen vererbt); sie werden Zeichen zugewiesen und jedes Zeichen kann einen von 23 definierten Werten (Bidirectional Character Types oder Bidi Class) annehmen. Es ist ganz und gar nicht so, dass die Zeichen des Blocks Basis-Lateinisch alle nur in rechtsläufien Schriften benutzt werden. Das trifft zum Beispiel nicht zu auf Kontrollzeichen, Whitespaces und Interpunktion. (Unabhängig von der Schreibrichtung kommen nur wenige Schriften ohne U+0020 SPACE aus. Momentan behaupten wir sogar Rechtsläufigkeit der Zeichen im Block Zusätzliche Interpunktion mit all seinen Whitespaces und Schreibrichtungs-Kontrollzeichen. Au weia! – Und man könnte meinen, Benutzer der arabischen Schrift würden auch Zahlen von rechts nach links schreiben, nur weil die Ziffern im selben Block sind wie die Konsonantenzeichen. Weit gefehlt!). Verschlimmert wird die Situation meines Erachtens noch dadurch, dass manchen Blöcken in der Spalte Schreibrichtung der Wert unbestimmt zugewiesen wird, was zusätzlich eine nicht vorhandene Bestimmtheit der anderen Werte suggeriert. Ich bin dafür, diese Spalte, die völlig in die Irre führt und nichts mit der internationalen Norm namens Unicode zu tun hat, ganz zu entfernen. Lieben Gruß —LiliCharlie (Disk.) 10:58, 23. Apr. 2020 (CEST)


Zu 1.: Ich würde den offiziellen Namen der Ebene zuerst hinschreiben; eine übliche Abkürzung, sofern vorhanden, dahinter in Klammern. Im Moment ist es leider andersrum.
Zu 2.: Im Prinzip hast du recht: Die Schreibrichtung ist für jedes Zeichen festgelegt, nicht für Blöcke. Ich fände es aber durchaus sinnvoll, anzugeben, welche Schreibrichtung die Zeichen in einem Block haben, wobei es vielleicht kurze Piktogramme auch tun würden, statt der jetzigen Abkürzungen "v.l.n.r.", die dann noch um ein Piktogramm ergänzt werden.
Wenn in einem Block Zeichen verschiedener Schreibrichtung vorkommen, dann schreibt man das eben rein: "unterschiedlich" (oder eben ein geeigntetes Piktogramm, das das verständlich darstellt).
Zudem würde ich die Spalte "Ebene" in der Liste der Blöcke rausnehmen, stattdessen lieber pro Ebene eine Tabelle machen. Ja, das schränkt eine ebenenübergreifende Sortierung ein, aber gewinnt dafür mehr wertvollen Platz in der Horizontalen.
--RokerHRO (Diskussion) 11:43, 23. Apr. 2020 (CEST)
Die „Schreibrichtung“ sollte als die typische Schreibrichtung einer Schrift verstanden werden; einmal pro Block. Dass es bei einzelnen Zeichen andere Interpretationen gibt, davon weiß der hochkomplexe und über die Jahre mehrfach verfeinerte und immer verzwicktere Unicode-Bidi-Algorithmus ein Lied zu singen. Das hängt davon ab, welches Zeichen neben welchem anderen aus derselben Schrift oder einer anderen (insbesondere neutral, Klammern, ASCII-Ziffern) stehen soll, und es kann immer noch andere Interpretationen geben (Ziffern nicht nur in alleinstehendem numerischen Wert, § 7b, Kfz-Kennzeichen).
Insofern kann es nur heißen, einen ganzen Block und die komplette arabische Schrift pauschal als „RTL“ einzustufen, wie das auch typischerweise gemacht wird – wie dann kombinierende diakritische Zeichen, Interpunktion, Klammern, Ziffern, Vokalzeichen gehandhabt werden, das ist dann innere Angelegenheit und nicht einem alleinstehenden Zeichen zuzuordnen.
VG --PerfektesChaos 12:31, 23. Apr. 2020 (CEST)
RokerHRO, ich verstehe nicht, was du mit dem „offiziellen Namen der Ebene“ meinst. „Plane 0F“ und „Plane 10“? Lieben Gruß —LiliCharlie (Disk.) 12:53, 23. Apr. 2020 (CEST)
Er meint wahrscheinlich Bezeichnungen wie Basic Multilingual Plane für Ebene 0 usw.
Zumindest für die Ebenen 0, 1 und 2 wäre je eine eigene Tabelle für die Blöcke nicht unpraktisch, ab Ebene 3 gibt es aber nicht so viele Blöcke, dass sich für jede Ebene eine eigene Tabelle lohnen würde. --Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 16:39, 23. Apr. 2020 (CEST)

Elymaisch oder Elymäisch?

Archivierung dieses Abschnittes wurde gewünscht von: Sascha (Diskussion) 13:50, 23. Dez. 2020 (CET)

Müsste der aktuell Elymaisch genannte Block auf Deutsch nicht „Elymäisch“ heissen? Vgl. hier oder hier. —Sascha (Diskussion) 09:06, 11. Jun. 2020 (CEST)

Ja, Elymäisch ist der Name, der inzwischen auch im Unicode Common Locale Data Repository (CLDR) benutzt wird, wenn auch noch mit dem Vermerk unconfirmed. (Wen es interessiert: Das aktuelle CLDR kann von hier heruntergeladen werden. Am besten den grünen Button Code anklicken, dann Download ZIP auswählen. Fürs Deutsche nach dem Entpacken die Datei de.xml im Ordner common\main\ öffnen, da steht’s drin.) – Der I-Umlaut, der aus dem a ein ä macht, ist im Deutschen allerdings nicht mehr zwingend, zum Beispiel heißt es ohne Umlaut ghanaisch und nicht ghanäisch. Lieben Gruß —LiliCharlie (Disk.) 14:32, 24. Sep. 2020 (CEST)

math. Symbole, Fraktur-R Groß

Hallo, ich habe versucht hier [1] ein fehlendes, großes Fraktur-R hinzuzufügen, aber irgend was scheint schief gegangen zu sein, ich sehe nur einen generischen Unicode-Blob mit Codepoint - und zwar sowohl in Windows als auch unter Linux. - wer lesen kann ist klar im Vorteil - Unicodeblock_Mathematische_alphanumerische_Symbole#Zeichen,_die_in_anderen_Blöcken_zu_finden_sind -- Theoprakt (Diskussion) 23:10, 28. Apr. 2020 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: ÅñŧóñŜûŝî (Ð) 19:55, 12. Mai 2022 (CEST)