U+203B Reference Mark
U+203B wurde in Version 1.1 in 1993 zu Unicode hinzugefügt. Er gehört zum Block
Dieses Zeichen ist ein Other Punctuation und wird allgemein verwendet, das heißt, in keiner speziellen Schrift. Das Schriftzeichen ist auch bekannt als Japanese kome und Urdu paragraph separator.
Das Zeichen ist keine Zusammensetzung. Seine Weite in ostasiatischen Texten wird vom Kontext bestimmt. Es kann weit oder schmal sein. In bidirektionalem Text handelt es als Other Neutral. Bei einem Richtungswechsel wird es nicht gespiegelt. Wenn seine ostasiatische Weite „schmal“ ist, bildet U+203B mit ähnlichen Zeichen ein Wort, das in sich Zeilenumbrüche verbietet. Andernfalls erlaubt es Zeilenumbrüche um sich herum, außer in einigen numerischen Kontexten.
Das CLDR-Projekt bezeichnet dieses Zeichen mit „Komejirushi“ für die Verwendung in Screenreader-Software. Es weist zusätzliche Namen zu, z.B. für die Suche in Emoji-Auswahlboxen: Glyphe, japanisch, Reismarke.
Die Wikipedia hat die folgende Information zu diesem Codepunkt:
Das Vierpunktkreuz, auch Komejirushi (japanisch 米印, wörtlich: Reismarke, Unicode: U+203B reference mark = Japanese Kome) ist ein Satzzeichen, das überwiegend im Japanischen benutzt wird. Der japanische Name weist auf die Ähnlichkeit des Zeichens mit dem Kanji 米 für Reis hin. Diese Herleitung bestätigt nicht die Ansicht, das Zeichen habe seinen Namen von den als verstreute Reiskörner gesehenen vier einzelnen Punkten.
Das Zeichen ist kein spezifisch japanisches, nur zu ostasiatischen CJK-Schriften typografisch passendes Satzzeichen (wie sie überwiegend im Unicode-Block „CJK-Symbole und -Interpunktion“ zu finden sind). Entsprechend findet sich das Zeichen auch in Schriftarten für Lateinschrift, z. B. der Linux Libertine.
Darstellungen
System | Darstellung |
---|---|
Nr. | 8251 |
UTF-8 | E2 80 BB |
UTF-16 | 20 3B |
UTF-32 | 00 00 20 3B |
URL-kodiert | %E2%80%BB |
HTML hex reference | ※ |
Falsches windows-1252-Mojibake | ※ |
Alias | Japanese kome |
Alias | Urdu paragraph separator |
Kodierung: BIG5 (Hex-Bytes) | A1 B0 |
Kodierung: BIG5HKSCS (Hex-Bytes) | A1 B0 |
Kodierung: CP932 (Hex-Bytes) | 81 A6 |
Kodierung: CP949 (Hex-Bytes) | A1 D8 |
Kodierung: CP950 (Hex-Bytes) | A1 B0 |
Kodierung: EUC_JP (Hex-Bytes) | A2 A8 |
Kodierung: EUC_JIS_2004 (Hex-Bytes) | A2 A8 |
Kodierung: EUC_JISX0213 (Hex-Bytes) | A2 A8 |
Kodierung: EUC_KR (Hex-Bytes) | A1 D8 |
Kodierung: GB2312 (Hex-Bytes) | A1 F9 |
Kodierung: GBK (Hex-Bytes) | A1 F9 |
Kodierung: GB18030 (Hex-Bytes) | A1 F9 |
Kodierung: HZ (Hex-Bytes) | 7E 7B 21 79 7E 7D |
Kodierung: ISO2022_JP (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_JP_1 (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_JP_2 (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_JP_2004 (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_JP_3 (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_JP_EXT (Hex-Bytes) | 1B 24 42 22 28 1B 28 42 |
Kodierung: ISO2022_KR (Hex-Bytes) | 1B 24 29 43 0E 21 58 0F |
Kodierung: JOHAB (Hex-Bytes) | D9 68 |
Kodierung: SHIFT_JIS (Hex-Bytes) | 81 A6 |
Kodierung: SHIFT_JIS_2004 (Hex-Bytes) | 81 A6 |
Kodierung: SHIFT_JISX0213 (Hex-Bytes) | 81 A6 |
Adobe Glyph List | referencemark |
Digraph | :X |
Anderswo
Vollständiger Eintrag
Eigenschaft | Wert |
---|---|
1.1 (1993) | |
REFERENCE MARK | |
— | |
General Punctuation | |
Other Punctuation | |
Common | |
Other Neutral | |
Not Reordered | |
none | |
|
|
✘ | |
|
|
|
|
✘ | |
|
|
|
|
|
|
|
|
|
|
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
Egal | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
0 | |
0 | |
0 | |
✘ | |
None | |
— | |
NA | |
Other | |
— | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Ja | |
Ja | |
|
|
Ja | |
|
|
Ja | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
Andere | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Andere | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
None | |
ambiguous | |
Nicht anwendbar | |
— | |
No_Joining_Group | |
Non Joining | |
Ambiguous (Alphabetic or Ideographic) | |
none | |
keine Nummer | |
|
|
U |