Кстати могу сказать чем меня не устраивает юникод: потенциально вынесенной диакритикой. То есть NFC решает вопрос как часть юникода, но меня в принципе не очень устраивает что могут быть вещи отличные от NFC.
О, привет! Более подходящего человека для обсуждения критериев адекватности я представить не мог 😁
// Как минимум отсутствие эмодзи; комбинируемых символов (zalgo); графемных кластеров в принципе; обскурных древних начертаний вроде символа в форме члена; backwards compatibility костылей типа символа {ㅤ}, благодаря которому я делаю поля в соцсетях пустыми; решение проблемы разных отсутствующих в Юникоде начертаний иероглифов; решение проблемы locale-dependent case transformations
Я тоже. Но не нравится. Возможно так было надо и они даже решили проблему через описание NFC, как я писал. Но при этом я не то чтобы много видел библиотек по обработке NFD - NFC - NFKD - NFKC, что печалит....
А нумеровать все возможные символы (объекты семиотики) как абстракции без явной формы — идея изначально противоречивая.
То, что в чате распределённых систем защищают систему с централизованной нерасширяемой таблицей знаков особенно интересно.
В качестве контрпримера можете представить себе систему, в которой рядом с данными есть контентхэш, указывающий на публично доступную таблицу графем+глифов, либо просто одну из well-known таблиц, доступных локально.