Size: a a a

2020 February 16

а

а это кто in rust_offtopic
polunin.ai
Я всегда думал что 8 - количество битов😅
В UTF-8 8 значит примерно ничего 😂
источник

p

polunin.ai in rust_offtopic
Понял
источник

а

а это кто in rust_offtopic
Alex Zhukovsky
это минимальное количество бит для символа, а вот максимальный - 6 байт
Вот да
источник

p

polunin.ai in rust_offtopic
Как это парсится, если там переменное количество байтов?
источник

а

а это кто in rust_offtopic
polunin.ai
Как это парсится, если там переменное количество байтов?
Если тебе действительно интересно — загугли
источник

p

polunin.ai in rust_offtopic
Ок
источник

B

Bogdan in rust_offtopic
жесть, спека юникод на 1200 страниц
при чем там не просто таблица, там слвоами символы описаны
источник

SP

Stanislav Popov in rust_offtopic
эмодзи
источник

B

Bogdan in rust_offtopic
Alex Zhukovsky
это минимальное количество бит для символа, а вот максимальный - 6 байт
это в utf8  т.е. если u32::MAX_VALUE закодировать в utf8 то будет 6 байт
источник

SP

Stanislav Popov in rust_offtopic
там чуть ли не тьюринг полный язык уоторый управляет апострофами
источник

а

а это кто in rust_offtopic
Bogdan
в общем мужской и женский фейспалм это два код-поинта
азиатский и черный это еще дополнительные кодпоинты)
Наврятли люди когда-то исчерпают ресурс UTF-32 (4.294.967.296 буков). Верно?…
источник

B

Bogdan in rust_offtopic
там куча битов тартится на сигнализацию о том, что "смотри в следующем байте"
источник

λ

λоλторт in rust_offtopic
Bogdan
там куча битов тартится на сигнализацию о том, что "смотри в следующем байте"
Это оправдано, учитывая то, что текст обычно состоит из букв
источник

p

polunin.ai in rust_offtopic
Bogdan
там куча битов тартится на сигнализацию о том, что "смотри в следующем байте"
Заебумба
источник

SP

Stanislav Popov in rust_offtopic
4  ЂÅӢƬА  メВΔ卞И卞  ВԸΣM
источник

а

а это кто in rust_offtopic
λоλторт
Это оправдано, учитывая то, что текст обычно состоит из букв
Что?
источник

p

polunin.ai in rust_offtopic
а это кто
Наврятли люди когда-то исчерпают ресурс UTF-32 (4.294.967.296 буков). Верно?…
Эмодзииииии
источник

B

Bogdan in rust_offtopic
λоλторт
Это оправдано, учитывая то, что текст обычно состоит из букв
мне честно говоря не понятно почему второй+ байт начинается с 10____ а не просто с 1____
источник

B

Bogdan in rust_offtopic
если в нолевом байте указывается к-во следующих байтов
источник

λ

λоλторт in rust_offtopic
Большая часть символов в интернете в UTF-8 использует всего один байт.
источник