Home: go to the homepage Szukaj All Planes Losowe

Znajdowanie znaków

It’s hard to find one certain character in over 155129 codepoints. This site aims to make it as easy as possible with the following search options:

  • Szukanie swobodne: po prostu wybierz zakładkę "Szukaj" lub skorzystaj z formularza na stronie głównej i wpisz kwerendę. W wielu przypadkach szukana współrzedna s pojawi się w wyniku.
  • Extended search: Na tej stronie można wyspecyfikować każdą właściwość standardu Unicode dla szukanej współrzędnej.
  • Kreator "Znaleźć mój Codepoint" : Odpowiedz na szereg pytań, aby znaleźć swój znak.

Jeśli zdarzy ci się już mieć interesujący cię znak, po prostu wklej go w polu wyszukiwania. Zaprowadzi Cię to bezpośrednio do strony jego opisu.

Czy znasz kształ znaku?

Nie znasz nazwy ani właściwości współrzędnej kodowej ale tylko ogólny wygląd znaku? l ? Nie martw się, na Shapecatcher można narysować znać, który zostanie rozpoznany. To działa całkiem dobrze dla wielu znaków.

Zaawansowane opcje

Jeśli znasz Unicode i znać w przybliżeniu zakres, do którego może należeć współrzędna kodowa, to możesz podać ten zakres bezpośrednio w adresie URL. Na przykład, aby sprawdzić znaków z zakresu U+0200 do U+0300, wpisz w pasek adresu "codepoints.net/U+0200..U+0300".

O standardzie Unicode

Komputery używają zer i jedynek przechowywania informacji. Aby uzyskać z takiego zapisu przydatne informacje, w naszym przypadku do wyświetlania tekstu, potrzebujemy, tzw kodowania, który informuje komputer, jak przekształcić zera i jedynki na alfabet. Pierwsze standardowe kodowanie to ASCII, które zasadniczo przypisuje proste litery łaciński górnej i dolnej kaszty, jak również cyfry i niektóre znaki interpunkcyjne, w sumie 128 pozycji. do W3C opublikowało bardzo dobre wprowadzenie na temat kodowania znaków.

128 pozycji nie wystarczyło na długo. Wiele instytucji i przedsiębiorstw zacząło stosować własne kodowania. W 2010 r. była imponująca liczba 250 kodowań powszechnie stosowanych, nie licząc jakieś tych mało znanych lub używanych prywatnie. Ta sytuacji okazała się katastrofalna, gdy komputery zaczęły rozmawiać się ze sobą przez Internet. Jeśli nadawca nie wskazał sposobu kodowania wiadomości, było duże szanse że odbiorca d otrzyma tylko się strumień bzdur i śmieci.

W ten sposób pojawia się Unicode. Adobe i Xerox zdecydowały w 1984 r., że aktualna sytuacja nie może być dalej akceptowana, i że istnieje potrzeba kodowania universalnego . w 1991 roku pojawiła się publikacja pierwszej wersji Unicode , a międzynarodowej normalizacja w formie ISO 10646 dwa lata później. (Zabawny fakt: ASCII jest standardem ISO 646, numer dla standardu Unicode został celowo wybrany.) Jednocześnie konsorcjum Unicode zaczęło się tworzyć w celu nadzorowania dalszego rozwoju standardu.

The most recent version of Unicode is 16.0.0, containing 155129 characters in over 100 different scripts. It’s encoding form UTF-8, a superset of ASCII, is the most popular encoding worldwide and the consortium counts Apple, Oracle, Microsoft, Google, IBM, Nokia and many others to its members.

Unicode stanowi mechanizm identyfikacji znaków w sposób uniwersalny. Wszystkim znakom się przypisane są "współrzędne kodowe", który wskazują je w sposób uniwersalny . Na przykład litera "A" ma przydzieloną współrzędną kodową 65 , a chiński znak "㐭" współrzędną 13357. Współrzędne są zwykle reprezentowane w zapisie keksadecymalnym, , gdzie litery "A" do "F" reprezentują cyfry 10 do 16.

Aby ustanowić w masiee 1,114,111 możliwych znaków jakiś pożyteczny porządekl , Unicode jest podzielony na 17 płaszczyzn, które są dalej podzielone na logicznie połączonych bloki. Istnieje dziesięć zasad, które rządzą rozszerzaniem i utrzymywaniem standardu Unicode:

  1. Uniwersalny repertuar: Każde system pisma kiedykolwiek używany powinien być szanowany i reprezentowany w standardzie
  2. Wydajność: Dokumentacja musi być efektywna i kompletna.
  3. Znaki, a nie glify: Tylko znaki, a nie glify, mogą być zakodowane. W skrócie, glify to rzeczywiste przedstawienia graficzne, a znaki są bardziej abstrakcyjne pojeciami, które leżą u ich podstaw.. Glify zmieniają się w różnych fontach, znaki nie.
  4. Semantyka: Included characters must be well defined and distinguished from others.
  5. Zwykły tekst: Znaki w standardzie są and tekstem i nigdy nie stanowią adiustacji lub metaznaków.
  6. Kolejność logiczna: W tekstach dwukierunkowych znaki są przechowywane w logicznej kolejności, a nie w sposób, który sugeruje wygląd.
  7. Unifikacja: Jeśli różne kultury i języki używają samego znaku, jest on uwzględniany tylko raz. Ta kwestia jest raczej dyskusyjna, , bo w Azji Wschodniej nie jest jasne, jak tą regułę stosować.
  8. Kompozycja dynamiczna: Nowe znaki składa się z innych, już dostępnych w standardzie znaków. Na przykład znak "Ä" może być złożony z "A" i znaku dierezy.
  9. Stabilność: Raz zdefiniowany znak nie powinien nigdy być usunięty lub mieć zmienioną współrzędną kodową. W przypadku błędu współrzędna kodowa staje się niezalecana.
  10. Konwertowalność: Każde inne używane kodowanie można reprezentować jako kodowanie Unicode.

O witrynie Codepoints

This website is a private project coordinated by Manuel Strehl. It is not affiliated with or approved by the Unicode Consortium. You can contact me via:

Manuel Strehl
℅ Kinetiqa GmbH
Bischof-von-Henle-Str. 2a
93051 Regensburg, Germany

WWW: manuel-strehl.de/contact

a sign in the style of an old wood board reading “Come in. We’re Open Source.”

Treści na tej stronie

The content on this website reflects the information found in
The Unicode Consortium. The Unicode Standard, Version 16.0.0, (Mountain View, CA: The Unicode Consortium, 2022. ISBN 978-1-936213-32-0)
www.unicode.org/versions/latest/,
which happens to be the most relevant version of the Unicode Standard as of November, 2022.

Jeśli zauważysz problemy, nieścisłości, błędy lub inne kwestie na tej witrynie, proszę wysłac e-mail do mnie lub zgłosic nowy błąd w śledzenie błędów. . Kod źródłowy dla tej witryny jest żywe na Github . Jeśli chcesz, zrób fork, rozbuduj go o wyslij mi żądanie pobrania. (Jeśli nie masz konta Github, wyślij proszę łatę jako e-mail.)

Nie ma żadnej gwarancji, że treść na tej witrynie są dokładne, kompletne i wolne od błędów! Dla informacji normatywnych prosze korzystać z oryginalnej witryny Unicode.

Licencja na ponowne wykorzystanie

Może ponownie użyć wszystkich treści na tej stronie pod następującymi warunkami. Informacje dotyczące Unicode są licencjonowane przez konsorcjum Unicode na zasadach Unicode warunki Use. Częśc korzystająca z JavaScript części biblioteki dostępne na różne licencjach, głównie licencji GPL i/lub licencji MIT. Szczegóły dostępne są w źródłach strony. Reprezentacje graficzne używają glifów z następujących fontów:

Obrazy oznaczające pojedyncze bloki Unicode są pobierane z fontu Unidings, którego autorem jest George Douros, udostepnionego na permisywnej licencji. Cytaty z Wikipedii są na licencji Creative Commons Attribution Share-alike. Szczegóły można uzyskać za pomocą linki znajdującego się w każdym cytacie. Geograficznej lokalizacja bloków (używane w Kreatorze "Znajdź moją współrzędną kodowa") jest oparta o kategoryzacji dostępnej na witrynie decodeunicode.org, i opublikowane na licencji CC BY-NC.

Cały kod stworzony specjalnie dla Codepoints.net jest udostępniony na licencji GPL i MIT, z możliwością wolnego wyboru przez Licencjobiorce. Oryginalne treści tej witryny są udostępnione na licencji Creative Commons Attribution 3.0 Germany. Uznanie autorstwa może mieć postać linku do witryny, opcjonalnie z tekstem "Na podstawie informacji z Codepoints.net".

Prywatność, statystyki

Ta witryna używa Matomo do gromadzenia statystyk o odsłonach stron. Jedynym celem jest ulepszenie tej witryny. Jeśli nie chcesz, aby Twoje wizyty nie były w ogóle śledzone, postępuj zgodnie z tymi instrukcjami :

Uznanie autorstwa & podziękowania

Przede wszystkim chcielibyśmy podziękować uczestnikom konsorcjum Unicode, których pracują nad standaryzacją istotnej części obliczeń, mianowicie wyswietlania znaków. To samo dotyczy autorówWikipedii, który gromadzą wiedzę na temat wielu aspektów świata liternictwa. Ich wkład jest ważną częścią tej witryny.

The Polish translation is kindly provided by Janusz S. Bień, utilizing the terminology introduced in his paper “Standard Unicode 4.0. Wybrane pojęcia i terminy” and subsequent publications.

Deweloperzy wspierający tę witrynę swoją wiedzą, sygnalizowaniem błędów i danymi mają duży wkład w utrzymywaniu jej na imponującym poziomie. Chcemy to podziękować specjalnie osobom rozwijajacym oprogramowanie:

Wielkie podziękiwania należą się też dwom witrynom o podobnym celu, lecz inaczej rozkładające akcenty w prezentowaniu standardu Unicode: Decode Unicode i Graphemica.

WHATWG publikuje encoding standard, który jest wykorzystywany tutaj dla dodatkowych informacje o współrzędnych kodowych. Jego głównym redaktorem jest Anne van Kesteren.

Hosted on Asteroids

Udostępnianie odbywa się na serwerze Uberspace, fantastycznym dostawcy Internetu z wyjątkowo miła i elastyczną obsługą.

LATEX nazwy wywodzą się z www.w3.org/Math/characters/unicode.xml, którego redaktorem jest David Carlisle i który jest dostarczany wraz z specyfikacją MathML konsocjum W3C.

Fonty

Wielu ludzi bazuje swoją pracę na standardzie Unicode. Chcemy podziękować Autorom tych fontów, że umożliwili ich ponownego wykorzystanie w tym projekcie:

Autorstwo grafiki

Obraz w tle strony głównej jest udostępniony na licencji Creative Commons Attribution przez użytkownika Flickr Willi Heidelbach. Tła przycisku na stronie głównej są w domenie publicznej: map z empire jest Charlemagne, 18 th wieku dowser, i NASA Marsa Rover.

Rysunek "We 're Open Source" jest udostepniony na licencji Creative Commons Attribution Non-Commercial No-Derivations przez użytkownika Flickr tima.

Ikony są częścią zestawu Font Awesome.


Na koniec chciałbym podziękować Mathias Bynens za zmobilizowanie mnie do opublikowania w końcu tej witryny.