Size: a a a

2020 September 08

KP

Kirill Pimenov in Distributed
То есть энтропия увеличивается, содержимое становится ближе к случайному.
Эти любые байты не будут содержаться в результате с равной вероятностью скорее всего, но они хотя бы будут в принципе.
источник

KP

Kirill Pimenov in Distributed
Это можно и самому проверить, взять любую толстую книжку, и прогнать её через архиватор с всё повышающейся степенью компрессии
источник

KP

Kirill Pimenov in Distributed
Потом померять сколько всего в этом энтропии содержится (это число должно быть более-менее постоянным), и сколько энтропии на байт (это число должно расти)
источник

KP

Kirill Pimenov in Distributed
А весь вопрос меток и прочих заголовков — это на самом деле всего лишь вопрос технического обеспечения "разжимаемости" на другой машине.
Эти заголовки вообще не обязательны как часть текста, и они могут легко быть захардкожены в архиваторах-деархиваторах.
Собственно, задаче-специфичные архиваторы (типа HPACK для шифрования http-заголовков в HTTP/2) так и делают — договариваются о словаре и параметрах в конкретной версии протокола, и дальше тупо всю метаинформацию до одной циферки-магического числа сводят
источник

KP

Kirill Pimenov in Distributed
Так, я могу перепутать, и это не HPACK поставляется со словарём, а Brotli
источник

KP

Kirill Pimenov in Distributed
Кому не лень — предлагается погуглить и поправить меня, если я не прав
источник

u

u836 in Distributed
О как, спасибо! Правильно ли я понимаю, что сами пожатые заголовки очень похожи на рандом, при этом словари, если они захардкожены, публичны и широко доступны?
источник

u

u836 in Distributed
Я к тому, насколько затратна проверка гипотезы  - а вдруг это пожато по алгоритму ххх словарем ууу?
источник

KP

Kirill Pimenov in Distributed
u836
О как, спасибо! Правильно ли я понимаю, что сами пожатые заголовки очень похожи на рандом, при этом словари, если они захардкожены, публичны и широко доступны?
Да.
источник

KP

Kirill Pimenov in Distributed
u836
Я к тому, насколько затратна проверка гипотезы  - а вдруг это пожато по алгоритму ххх словарем ууу?
Ну, надо разжать и посмотреть, имеет ли результат какой-то смысл
источник

KP

Kirill Pimenov in Distributed
Получится ли вот это посмотреть — сильно зависит от контекста
источник

KP

Kirill Pimenov in Distributed
Но в конечном счёте у сжатия и задачи такой не стоит, сделать текст неотличимым от чего-то другого.
источник

KP

Kirill Pimenov in Distributed
Для этого надо либо криптографию, либо стеганографию использовать
источник

KP

Kirill Pimenov in Distributed
Результат шифрования — неотличим от случайных данных без знания ключа.
Это (очень грубый пересказ) определение стойкого шифрования
источник

KP

Kirill Pimenov in Distributed
Результат стеганографии — неотличим от произвольных данных-контейнера без знания ключа (или наличия точной копии контейнера до того, как его обогатили стеганографией)
источник

KP

Kirill Pimenov in Distributed
Но понятно что ёмкость информации в этих случаях отличается на порядки
источник

u

u836 in Distributed
Kirill Pimenov
Результат шифрования — неотличим от случайных данных без знания ключа.
Это (очень грубый пересказ) определение стойкого шифрования
Вот, а для этого надо поломать неслучайные частоты символов, слов, присущих исходному открытому неслучайному тексту. В том и искусство разработать алгоритм.
источник

KP

Kirill Pimenov in Distributed
u836
Вот, а для этого надо поломать неслучайные частоты символов, слов, присущих исходному открытому неслучайному тексту. В том и искусство разработать алгоритм.
Да не только. Там много же атак, которым пристойный алгоритм шифрования должен противостоять.
Скажем, chosen plaintext attack состоит в том, что ты заставляешь жертву зашифровать известное тебе сообщение, и потом используешь пару шифротекст-открытый текст чтобы вычислить ключ.
Во время Второй Мировой союзники специально минировали и разминировали порты, чтобы спровоцировать немцев отправить шифродепеши, о содержимом которых было не так сложно догадаться — и так помогали своим OG-криптанам реверсить ключи
источник

KP

Kirill Pimenov in Distributed
Понятно что современные симметричные шифры гораздо устойчивее в этом смысле.
источник

u

u836 in Distributed
Возвращаясь к оригинальному вопросу про замену слов, это же по факту вариация старого доброго шифра с заменами, который был актуален до первых эвм.
источник