U+2014 EM DASH: — – Unicode

U+2014 wurde in Version 1.1 in 1993 zu Unicode hinzugefügt. Er gehört zum Block U+2000 bis U+206F General Punctuation in der U+0000 bis U+FFFF Basic Multilingual Plane.

Dieses Zeichen ist ein Dash Punctuation und wird allgemein verwendet, das heißt, in keiner speziellen Schrift.

Das Zeichen ist keine Zusammensetzung. Seine Weite in ostasiatischen Texten wird vom Kontext bestimmt. Es kann weit oder schmal sein. In bidirektionalem Text handelt es als Other Neutral. Bei einem Richtungswechsel wird es nicht gespiegelt. Es wird Sätze nicht beenden. U+2014 bietet eine Zeilenumbruch-Gelegenheit an seiner Position. Der Buchstabe kann mit einem anderen Zeichen verwechselt werden.

Das CLDR-Projekt bezeichnet dieses Zeichen mit „Geviertstrich“ für die Verwendung in Screenreader-Software. Es weist zusätzliche Namen zu, z.B. für die Suche in Emoji-Auswahlboxen: Strich.

Die Wikipedia hat die folgende Information zu diesem Codepunkt:

Der Geviertstrich (—) ist in der Typografie ein waagerechter Strich, der ein Geviert lang ist. Er wird verwendet als Spiegelstrich und in Tabellen sowie als Gedankenstrich in verschiedenen Sprachen wie dem Englischen und dem Spanischen. Andere waagerechte Striche sind das Minuszeichen, der Viertelgeviertstrich, der Halbgeviertstrich und der Doppelgeviertstrich sowie das Bindestrich-Minus.

Darstellungen

System	Darstellung
Nr.	8212
UTF-8	E2 80 94
UTF-16	20 14
UTF-32	00 00 20 14
URL-kodiert	%E2%80%94
HTML hex reference	—
Falsches windows-1252-Mojibake	â€”
HTML named entity	—
Kodierung: BIG5 (Hex-Bytes)	A1 58
Kodierung: BIG5HKSCS (Hex-Bytes)	A1 58
Kodierung: CP874 (Hex-Bytes)	97
Kodierung: CP950 (Hex-Bytes)	A1 58
Kodierung: CP1250 (Hex-Bytes)	97
Kodierung: CP1251 (Hex-Bytes)	97
Kodierung: CP1252 (Hex-Bytes)	97
Kodierung: CP1253 (Hex-Bytes)	97
Kodierung: CP1254 (Hex-Bytes)	97
Kodierung: CP1255 (Hex-Bytes)	97
Kodierung: CP1256 (Hex-Bytes)	97
Kodierung: CP1257 (Hex-Bytes)	97
Kodierung: CP1258 (Hex-Bytes)	97
Kodierung: GBK (Hex-Bytes)	A1 AA
Kodierung: GB18030 (Hex-Bytes)	A1 AA
Kodierung: KOI8_T (Hex-Bytes)	97
Kodierung: KZ1048 (Hex-Bytes)	97
Kodierung: MAC_CYRILLIC (Hex-Bytes)	D1
Kodierung: MAC_ICELAND (Hex-Bytes)	D1
Kodierung: MAC_LATIN2 (Hex-Bytes)	D1
Kodierung: MAC_ROMAN (Hex-Bytes)	D1
Kodierung: MAC_TURKISH (Hex-Bytes)	D1
Kodierung: PTCP154 (Hex-Bytes)	97
L^AT_EX	\textemdash
AGL: Latin-1	emdash
AGL: Latin-2	emdash
AGL: Latin-3	emdash
AGL: Latin-4	emdash
AGL: Latin-5	emdash
Adobe Glyph List	emdash
Digraph	-M

Anderswo

Vollständiger Eintrag

Eigenschaft	Wert
Alter (age)	1.1 (1993)
Unicode-Name (na)	EM DASH
Unicode-1-Name (na1)	—
Block (blk)	General Punctuation
Allgemeine Kategorie (gc)	Dash Punctuation
Schrift (sc)	Common
Bidirectional Category (bc)	Other Neutral
Combining Class (ccc)	Not Reordered
Dekompositionstyp (dt)	none
Decomposition Mapping (dm)	Em Dash
Kleinbuchstabe (Lower)	✘︎
Simple Lowercase Mapping (slc)	Em Dash
Lowercase Mapping (lc)	Em Dash
Großbuchstabe (Upper)	✘︎
Simple Uppercase Mapping (suc)	Em Dash
Uppercase Mapping (uc)	Em Dash
Simple Titlecase Mapping (stc)	Em Dash
Titlecase Mapping (tc)	Em Dash
Case Folding (cf)	Em Dash
ASCII Hex Digit (AHex)	✘︎
Alphabetic (Alpha)	✘︎
Bidi-Kontrollzeichen (Bidi_C)	✘︎
Bidi Mirrored (Bidi_M)	✘︎
Composition Exclusion (CE)	✘︎
Case Ignorable (CI)	✘︎
Changes When Casefolded (CWCF)	✘︎
Changes When Casemapped (CWCM)	✘︎
Changes When NFKC Casefolded (CWKCF)	✘︎
Changes When Lowercased (CWL)	✘︎
Changes When Titlecased (CWT)	✘︎
Changes When Uppercased (CWU)	✘︎
Cased (Cased)	✘︎
Full Composition Exclusion (Comp_Ex)	✘︎
Default Ignorable Code Point (DI)	✘︎
Dash (Dash)	✔︎
Veraltet (Dep)	✘︎
Diakritisch (Dia)	✘︎
Emoji Modifier Base (EBase)	✘︎
Emoji Component (EComp)	✘︎
Emoji Modifier (EMod)	✘︎
Emoji-Darstellung (EPres)	✘︎
Emoji (Emoji)	✘︎
Extender (Ext)	✘︎
Extended Pictographic (ExtPict)	✘︎
FC NFKC Closure (FC_NFKC)	Em Dash
Grapheme Cluster Break (GCB)	Egal
Grapheme Base (Gr_Base)	✔︎
Grapheme Extend (Gr_Ext)	✘︎
Grapheme Link (Gr_Link)	✘︎
Hex Digit (Hex)	✘︎
Hyphen (Hyphen)	✘︎
ID Continue (IDC)	✘︎
ID-Start (IDS)	✘︎
IDS Binary Operator (IDSB)	✘︎
IDS Trinary Operator and (IDST)	✘︎
IDSU (IDSU)	0
ID_Compat_Math_Continue (ID_Compat_Math_Continue)	0
ID_Compat_Math_Start (ID_Compat_Math_Start)	0
Ideogramm (Ideo)	✘︎
InCB (InCB)	None
Indic Mantra Category (InMC)	—
Indic Positional Category (InPC)	NA
Indic Syllabic Category (InSC)	Consonant_Placeholder
Jamo Short Name (JSN)	—
Verbindungskontrollzeichen (Join_C)	✘︎
Logische Reihenfolgenausnahme (LOE)	✘︎
Modifier Combining Mark (MCM)	✘︎
Math (Math)	✘︎
Nicht-Zeichen-Codepunkt (NChar)	✘︎
NFC Quick Check (NFC_QC)	Ja
NFD Quick Check (NFD_QC)	Ja
NFKC Casefold (NFKC_CF)	Em Dash
NFKC Quick Check (NFKC_QC)	Ja
NFKC_SCF (NFKC_SCF)	Em Dash
NFKD Quick Check (NFKD_QC)	Ja
Other Alphabetic (OAlpha)	✘︎
Other Default Ignorable Code Point (ODI)	✘︎
Other Grapheme Extend (OGr_Ext)	✘︎
Other ID Continue (OIDC)	✘︎
Other ID Start (OIDS)	✘︎
Other Lowercase (OLower)	✘︎
Other Math (OMath)	✘︎
Other Uppercase (OUpper)	✘︎
Prepended Concatenation Mark (PCM)	✘︎
Pattern Syntax (Pat_Syn)	✔︎
Pattern White Space (Pat_WS)	✘︎
Quotation Mark (QMark)	✘︎
Regional Indicator (RI)	✘︎
Radical (Radical)	✘︎
Sentence Break (SB)	Sentence Continue
Soft Dotted (SD)	✘︎
Sentence Terminal (STerm)	✘︎
Terminal Punctuation (Term)	✘︎
Unified Ideograph (UIdeo)	✘︎
Variation Selector (VS)	✘︎
Word Break (WB)	Andere
White Space (WSpace)	✘︎
XID Continue (XIDC)	✘︎
XID-Start (XIDS)	✘︎
Expands On NFC (XO_NFC)	✘︎
Expands On NFD (XO_NFD)	✘︎
Expands On NFKC (XO_NFKC)	✘︎
Expands On NFKD (XO_NFKD)	✘︎
Bidi Paired Bracket (bpb)	Em Dash
Bidi Paired Bracket Type (bpt)	None
Ostasiatische Weite (ea)	ambiguous
Hangul Syllable Type (hst)	Nicht anwendbar
ISO 10646 Comment (isc)	—
Joining Group (jg)	No_Joining_Group
Joining Type (jt)	Non Joining
Line Break (lb)	Break Opportunity Before and After
Numerischer Typ (nt)	none
Numerischer Wert (nv)	keine Nummer
Simple Case Folding (scf)	Em Dash
Schrifterweiterung (scx)
Vertical Orientation (vo)	R

U+2014 Em Dash

Darstellungen

Verwandte Schriftzeichen

Verwechselbare

Anderswo

Vollständiger Eintrag