Size: a a a

2021 August 22

WD

Wisketchy Dobrov in Distributed
Дунно как в поле это, впрочем, я дома с двумя телефонами относительно рядом
источник

A.

Anton .so in Distributed
ну что-то прям конкретно расколбасило, и это на ведре, на десктопе просто квадратики
источник

EL

Evgeny Link in Distributed
Интересно, когда запилят адекватную альтернативу юникодопараше
источник

ДК

Дим К in Distributed
А какие критерии адекватности?
источник

@

@mr_tron in Distributed
А чем тебя юникод не устраивает? Это просто система сквозной нумерации символов разных алфавитов
источник

EL

Evgeny Link in Distributed
Прошу прощения, UTF-8, конечно
источник

PZ

Pavel Zlatovratskii in Distributed
Ну у тебя есть UTF-16 и UTF-32.

Каждая из трёх имеет свои плюсы и минусы.
Например UTF-8 конечно адски оптимальна если у тебя заметная часть символов ASCII
источник

@

@mr_tron in Distributed
А чем тебя utf8 не устраивает?
источник

PZ

Pavel Zlatovratskii in Distributed
Кстати могу сказать чем меня не устраивает юникод: потенциально вынесенной диакритикой. То есть NFC решает вопрос как часть юникода, но меня в принципе не очень устраивает что могут быть вещи отличные от NFC.
источник

@

@mr_tron in Distributed
Ну да. С конструкторами символов они перемудрили. Но с другой стороны я не достаточно компетентен утверждать что это не было лучшим решением.
источник

EL

Evgeny Link in Distributed
О, привет! Более подходящего человека для обсуждения критериев адекватности я представить не мог 😁

// Как минимум отсутствие эмодзи; комбинируемых символов (zalgo); графемных кластеров в принципе; обскурных древних начертаний вроде символа в форме члена; backwards compatibility костылей типа символа {ㅤ}, благодаря которому я делаю поля в соцсетях пустыми; решение проблемы разных отсутствующих в Юникоде начертаний иероглифов; решение проблемы locale-dependent case transformations

Проблем и в Юникоде, и в UTF-8
источник

PZ

Pavel Zlatovratskii in Distributed
Я тоже. Но не нравится. Возможно так было надо и они даже решили проблему через описание NFC, как я писал.
Но при этом я не то чтобы много видел библиотек по обработке NFD - NFC - NFKD - NFKC, что печалит....
источник

EL

Evgeny Link in Distributed
Когда-нибудь люди научатся не класть в одно место текст, символы, картинки, контрольные сигналы, мета-символы типографской разметки, ...

(Нужно типировать, сложная штука, я сейчас работаю над концептами /* воскрешение WYSIWYG */)
источник

PZ

Pavel Zlatovratskii in Distributed
Эмм? Ты сейчас буквально пишешь в стиле "мне не надо - запретите всему миру". Детский сад, извинити...
источник

@

@mr_tron in Distributed
Ага. Начнут класть в разные и постоянно их смешивать, а потом придумают стандарт для объединения.
источник

EL

Evgeny Link in Distributed
Стандарт уже есть, называется bitmap image.

А нумеровать все возможные символы (объекты семиотики) как абстракции без явной формы — идея изначально противоречивая.

То, что в чате распределённых систем защищают систему с централизованной нерасширяемой таблицей знаков особенно интересно.

В качестве контрпримера можете представить себе систему, в которой рядом с данными есть контентхэш, указывающий на публично доступную таблицу графем+глифов, либо просто одну из well-known таблиц, доступных локально.

Дальше спорить не буду х)
источник

ДК

Дим К in Distributed
Учитывая повсеместное применение сжатия, от этой оптимальности мало проку.
источник

WD

Wisketchy Dobrov in Distributed
>То, что в чате распределённых систем защищают централизованную систему

вау, отличный ход, буду использовать. Алсо, предлагаю заодно отказаться от централизованного тела и перейти к жизни в виде отдельных клеток
источник

EL

Evgeny Link in Distributed
Так и надо, критиковать форму, а не суть, класс, буду использовать
источник

EL

Evgeny Link in Distributed
Пока память с transparent compression не используется, UTF-32 при работе занимает больше места (?)

Ещё есть какая-то спецификация для пожатого юникода, не уверен что с ней
источник