U+2014 Em Dash
U+2014 wurde in Version 1.1 in 1993 zu Unicode hinzugefügt. Er gehört zum Block
Dieses Zeichen ist ein Dash Punctuation und wird allgemein verwendet, das heißt, in keiner speziellen Schrift.
Das Zeichen ist keine Zusammensetzung. Seine Weite in ostasiatischen Texten wird vom Kontext bestimmt. Es kann weit oder schmal sein. In bidirektionalem Text handelt es als Other Neutral. Bei einem Richtungswechsel wird es nicht gespiegelt. Es wird Sätze nicht beenden. U+2014 bietet eine Zeilenumbruch-Gelegenheit an seiner Position. Der Buchstabe kann mit einem anderen Zeichen verwechselt werden.
Das CLDR-Projekt bezeichnet dieses Zeichen mit „Geviertstrich“ für die Verwendung in Screenreader-Software. Es weist zusätzliche Namen zu, z.B. für die Suche in Emoji-Auswahlboxen: Strich.
Die Wikipedia hat die folgende Information zu diesem Codepunkt:
Der Geviertstrich (—) ist in der Typografie ein waagerechter Strich, der ein Geviert lang ist. Er wird verwendet als Spiegelstrich und in Tabellen sowie als Gedankenstrich in verschiedenen Sprachen wie dem Englischen und dem Spanischen. Andere waagerechte Striche sind das Minuszeichen, der Viertelgeviertstrich, der Halbgeviertstrich und der Doppelgeviertstrich sowie das Bindestrich-Minus.
Darstellungen
System | Darstellung |
---|---|
Nr. | 8212 |
UTF-8 | E2 80 94 |
UTF-16 | 20 14 |
UTF-32 | 00 00 20 14 |
URL-kodiert | %E2%80%94 |
HTML hex reference | — |
Falsches windows-1252-Mojibake | — |
HTML named entity | — |
Kodierung: BIG5 (Hex-Bytes) | A1 58 |
Kodierung: BIG5HKSCS (Hex-Bytes) | A1 58 |
Kodierung: CP874 (Hex-Bytes) | 97 |
Kodierung: CP950 (Hex-Bytes) | A1 58 |
Kodierung: CP1250 (Hex-Bytes) | 97 |
Kodierung: CP1251 (Hex-Bytes) | 97 |
Kodierung: CP1252 (Hex-Bytes) | 97 |
Kodierung: CP1253 (Hex-Bytes) | 97 |
Kodierung: CP1254 (Hex-Bytes) | 97 |
Kodierung: CP1255 (Hex-Bytes) | 97 |
Kodierung: CP1256 (Hex-Bytes) | 97 |
Kodierung: CP1257 (Hex-Bytes) | 97 |
Kodierung: CP1258 (Hex-Bytes) | 97 |
Kodierung: GBK (Hex-Bytes) | A1 AA |
Kodierung: GB18030 (Hex-Bytes) | A1 AA |
Kodierung: KOI8_T (Hex-Bytes) | 97 |
Kodierung: KZ1048 (Hex-Bytes) | 97 |
Kodierung: MAC_CYRILLIC (Hex-Bytes) | D1 |
Kodierung: MAC_ICELAND (Hex-Bytes) | D1 |
Kodierung: MAC_LATIN2 (Hex-Bytes) | D1 |
Kodierung: MAC_ROMAN (Hex-Bytes) | D1 |
Kodierung: MAC_TURKISH (Hex-Bytes) | D1 |
Kodierung: PTCP154 (Hex-Bytes) | 97 |
LATEX | \textemdash |
AGL: Latin-1 | emdash |
AGL: Latin-2 | emdash |
AGL: Latin-3 | emdash |
AGL: Latin-4 | emdash |
AGL: Latin-5 | emdash |
Adobe Glyph List | emdash |
Digraph | -M |
Verwandte Schriftzeichen
Verwechselbare
Anderswo
Vollständiger Eintrag
Eigenschaft | Wert |
---|---|
1.1 (1993) | |
EM DASH | |
— | |
General Punctuation | |
Dash Punctuation | |
Common | |
Other Neutral | |
Not Reordered | |
none | |
|
|
✘ | |
|
|
|
|
✘ | |
|
|
|
|
|
|
|
|
|
|
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
Egal | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
0 | |
0 | |
0 | |
✘ | |
None | |
— | |
NA | |
Consonant_Placeholder | |
— | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Ja | |
Ja | |
|
|
Ja | |
|
|
Ja | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
Sentence Continue | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Andere | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
None | |
ambiguous | |
Nicht anwendbar | |
— | |
No_Joining_Group | |
Non Joining | |
Break Opportunity Before and After | |
none | |
keine Nummer | |
|
|
R |