U+5B57 CJK Unified Ideograph-5B57
U+5B57 was added in Unicode version 1.1 in 1993. It belongs to the block
This character is a Other Letter and is mainly used in the Han script. La base de datos de Unihan lo define como letter, character, word. Su pronunciación en Pīnyīn es zì.
The glyph is not a composition. Its East Asian Width is wide. In bidirectional text it is written from left to right. When changing direction it is not mirrored. U+5B57 offers a line break opportunity at its position, except in some numeric contexts.
El Wikipedia tiene la siguiente información acerca de este punto de código:
Los caracteres chinos, a veces llamados sinogramas (汉字/漢字, chino: hànzì, japonés: kanji, coreano: hanja; literalmente, ‘carácter han’), son un sistema de escritura de tipo logográfico y originalmente silábico, desarrollado por los chinos han en torno a la llanura del río Amarillo y adoptado por varias naciones de Asia Oriental (sinoesfera). Los sinogramas eran utilizados antiguamente por las naciones de Asia del Este para escribir textos en chino clásico, y posteriormente lo han sido en la escritura china y la japonesa, así como en la coreana, en la antigua escritura vietnamita y en otros idiomas.
Los caracteres chinos son morfosilábicos: cada uno corresponde a una sílaba pronunciada y aporta un significado elemental; esto no pasa por ejemplo en los kanjis del japonés. En chino moderno muchas palabras son bisilábicas o polisilábicas, y por tanto se escriben con dos o más sinogramas, y tienen un significado que no se deduce automáticamente de la suma de los sinogramas que las componen.[1] Los cognados entre dialectos chinos tienen la misma escritura (el mismo sinograma) y significados similares pero suelen tener pronunciaciones diferentes.
Los sinogramas japoneses (kanji) se comportan como lexemas y la escritura se complementa con los silabarios japoneses. En japonés un sinograma tiene casi siempre varias pronunciaciones distintas, y cada una de estas puede tener varias sílabas. De otros idiomas nacionales, destaca el coreano (hanja), que los ha sustituido casi del todo por el alfabeto coreano, pero los siguen utilizando para desambiguar palabras homófonas, y el vietnamita (hán tự) que los ha sustituido completamente por un nuevo sistema de escritura, el alfabeto vietnamita, formado por letras latinas con diacríticos. En estos casos los sinogramas pueden representar solo el significado original chino con la pronunciación del idioma local, si bien la pronunciación también puede derivar del chino en el caso de palabras tomadas del chino. Las pronunciaciones extranjeras de caracteres chinos se conocen como sinoxénicas.
Representaciones
Sistema | Representación |
---|---|
N.º | 23383 |
UTF-8 | E5 AD 97 |
UTF-16 | 5B 57 |
UTF-32 | 00 00 5B 57 |
URL-Quoted | %E5%AD%97 |
HTML hex reference | 字 |
Mojibake mal de windows-1252 | å— |
Codificación: BIG5 (hexadecimales bytes) | A6 72 |
Codificación: BIG5HKSCS (hexadecimales bytes) | A6 72 |
Codificación: CP932 (hexadecimales bytes) | 8E 9A |
Codificación: CP949 (hexadecimales bytes) | ED AE |
Codificación: CP950 (hexadecimales bytes) | A6 72 |
Codificación: EUC_JP (hexadecimales bytes) | BB FA |
Codificación: EUC_JIS_2004 (hexadecimales bytes) | BB FA |
Codificación: EUC_JISX0213 (hexadecimales bytes) | BB FA |
Codificación: EUC_KR (hexadecimales bytes) | ED AE |
Codificación: GB2312 (hexadecimales bytes) | D7 D6 |
Codificación: GBK (hexadecimales bytes) | D7 D6 |
Codificación: GB18030 (hexadecimales bytes) | D7 D6 |
Codificación: HZ (hexadecimales bytes) | 7E 7B 57 56 7E 7D |
Codificación: ISO2022_JP (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_JP_1 (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_JP_2 (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_JP_2004 (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_JP_3 (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_JP_EXT (hexadecimales bytes) | 1B 24 42 3B 7A 1B 28 42 |
Codificación: ISO2022_KR (hexadecimales bytes) | 1B 24 29 43 0E 6D 2E 0F |
Codificación: JOHAB (hexadecimales bytes) | F1 AE |
Codificación: SHIFT_JIS (hexadecimales bytes) | 8E 9A |
Codificación: SHIFT_JIS_2004 (hexadecimales bytes) | 8E 9A |
Codificación: SHIFT_JISX0213 (hexadecimales bytes) | 8E 9A |
Pīnyīn | zì |
Caracteres relacionados
Otros sitios
Registro completo
Propiedad | Valor |
---|---|
1.1 (1993) | |
CJK UNIFIED IDEOGRAPH-5B57 | |
— | |
CJK Unified Ideographs | |
Other Letter | |
Han | |
Left To Right | |
Not Reordered | |
none | |
|
|
✘ | |
|
|
|
|
✘ | |
|
|
|
|
|
|
|
|
|
|
✘ | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
Any | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
✔ | |
✔ | |
✘ | |
✘ | |
0 | |
0 | |
0 | |
✔ | |
None | |
— | |
NA | |
Other | |
— | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Sí | |
Sí | |
|
|
Sí | |
|
|
Sí | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
✘ | |
Other Letter | |
✘ | |
✘ | |
✘ | |
✔ | |
✘ | |
Other | |
✘ | |
✔ | |
✔ | |
✘ | |
✘ | |
✘ | |
✘ | |
|
|
None | |
wide | |
Not Applicable | |
— | |
No_Joining_Group | |
Non Joining | |
Ideographic | |
none | |
not a number | |
|
|
U | |
A672 | |
213A52 | |
1-4773 | |
1-4773 | |
JND | |
zi6 | |
398.103 | |
4672 | |
0545.070 | |
letter, character, word | |
213A52 | |
疾置 | |
112A | |
586.02 587.01 | |
3040.7 | |
5554 | |
5554 | |
0964n | |
1 | |
0974 | |
21010.020 | |
자:0E | |
zì(676) zi(138) | |
21010.020:zì | |
AGTJHKMP | |
0545.070 | |
21010.020 | |
0277.180 | |
G0-5756 | |
HB1-A672 | |
J0-3B7A | |
KP0-E6AF | |
K0-6D2E | |
T1-4773 | |
V1-523E | |
ジ シ あざ あざな やしなう | |
AZA UMU MASU | |
JI | |
2790 | |
2010 | |
0277.180 | |
CA | |
2007 | |
1446 | |
1316 | |
zì | |
6942 | |
3536 | |
MJ010057 | |
06942 | |
1281 | |
134 147 | |
C+2248+39.3.3 C+2248+40.3.3 | |
39.3 | |
357.13 | |
163.06 166.09 | |
zì粵zi6 | |
2013:548 | |
492.140:zì | |
1316 | |
*dzhiə̀ dzhiə̀ | |
6 | |
GHJKMPT | |
tự | |
1533.040:zì | |
242:041 |