Size: a a a

2020 September 07

NL

Nikita Lindmann in Distributed
Kirill Pimenov
Да причём тут это?
Это ж общеобразовательная дискуссия, а не срач.
Было бы странно персонально переживать, что в ней кто-то неправ.

Мне скорее жалко, что кроме меня никто не видит перед собой образовательной миссии тут, а только досуговую — и поэтому про инженерный подход к криптографии никто даже не заикнулся.
Так не победим, увы
Уррвень дискуссии не доходит до общеобразовательной, это разговоры на кухне. И еже ли потраченого на учасьтие времени жаль - то не стоило участвовать?

Впрочем, тут уже мне не стоит участвовать.
источник

R

Razrazraz in Distributed
Собственно вопрос назрел.
Занимался ли кто-то кодированием,когда идет кодирование не по буквам,а целыми словами?
С учетом регистра и тд.
К примеру привет - 12odsja , Привет - 2394jOk.
источник

KP

Kirill Pimenov in Distributed
Razrazraz
Собственно вопрос назрел.
Занимался ли кто-то кодированием,когда идет кодирование не по буквам,а целыми словами?
С учетом регистра и тд.
К примеру привет - 12odsja , Привет - 2394jOk.
А нету разницы.
Криптография на машине, где в байте — сто бит, она такая же, как и там где восемь.

Так и тут, какая разница что является условным "байтом", буква или слово.
Если мы можем сделать стойким что-то одно, то и другое тоже можем
источник

R

Razrazraz in Distributed
Kirill Pimenov
А нету разницы.
Криптография на машине, где в байте — сто бит, она такая же, как и там где восемь.

Так и тут, какая разница что является условным "байтом", буква или слово.
Если мы можем сделать стойким что-то одно, то и другое тоже можем
Получается смысла в такой заморочке как я написал выше никакого?
источник

KP

Kirill Pimenov in Distributed
Razrazraz
Получается смысла в такой заморочке как я написал выше никакого?
Ну, в каком-то смысле она есть.
Можешь посмотреть, зачем блочным шифрам собственно блоки
источник
2020 September 08

u

u836 in Distributed
Razrazraz
Собственно вопрос назрел.
Занимался ли кто-то кодированием,когда идет кодирование не по буквам,а целыми словами?
С учетом регистра и тд.
К примеру привет - 12odsja , Привет - 2394jOk.
Это хороший вопрос на самом деле. Короткий ответ - нет. Длинный ответ. Есть способ взлома любого шифра, с неизвестными ключами и даже алгоритмом кодирования - перебор. Однако он довольно быстро теряет смысл даже на эвм. Казалось бы усе, но нет. Любые полезные тексты, данные имеют регулярную, неслучайную структуру - одни буквы алфавита встречаются в тексте чаще других (частоты давно известны), одни слова в языке чаще употребимы чем другие (тот же привет)), есть междометия и предлоги, допустим в видеофайле есть служебные метки и заголовки, xml пестрит скобками и т.д. Если у тебя есть достаточный обьем зашифрованных текстов, можно попробовать выделить повторяющиеся элементы, проанализировать их частоту, попытаться сопоставить с предполагаемым текстом. Это называется частотный анализ, рекомендую погуглить. Именно так была взломана Энигма - тексты донесений начинались со стандартного приветствия, а заканчивались восхвалением фюрера. Так расшифровали мертвые языки - древнеегипетский, клинопись.
источник

u

u836 in Distributed
Алгоритму перебора вобшем то все равно, как и на что меняется, главное чтобы сохранялась частота. А для разработчиков шифра стоят противоречивые задачи - эту частоту убрать, поломать, сделать максимально случайной, при этом сам алгоритм шифрования не должен быть слишком затратным по вычислениям
источник

u

u836 in Distributed
И вдогонку - единственный вид открытого текста, который не поддается такому анализу - полностью случайный набор. Однако практического смысла в нем мало.
источник

G

Gigajoule in Distributed
Dvevgvvdj scbb sdvvr, hhdvvj ddddjjvdhj 3. Djbvcd dkksvcd?
источник

DB

Drunk Bootlegger in Distributed
источник

YB

Yanis Benson in Distributed
u836
И вдогонку - единственный вид открытого текста, который не поддается такому анализу - полностью случайный набор. Однако практического смысла в нем мало.
Падажжи, современное шифрование предполагает, что ты во-первых, не можешь перебрать все расшифровки одного блока, во-вторых, даже если ты их переберешь, тебе нужны крайне четкие критерии определения верности плейнтекста, потому что частотный анализ мало сработает с такими короткими блоками, и в-третьих, часто ключ будет не единый, а порождаемый, так что вытащить из одного блока с известным плейнтестом ключ нельзя.
источник

u

u836 in Distributed
Конечно не сработает. Насколько я знаю даже теоремы есть всякие, про количество шифротекстов, длинну ключа и теоретическую возможность. Человек просто свое изобретает, я и привел ему исторический пример, с похожим вопросом столкнулись уже тогда.
источник

NL

Nikita Lindmann in Distributed
u836
И вдогонку - единственный вид открытого текста, который не поддается такому анализу - полностью случайный набор. Однако практического смысла в нем мало.
К этому качеству можно приблизиться, сжав исходный текст.
источник

u

u836 in Distributed
Сжатие добавит свои служебные маркеры, характерные для формата - заголовки файла, какие-то внутренние служебные метки и т.д., но не случайности.
источник

SB

Sergey Bychkow in Distributed
Razrazraz
Собственно вопрос назрел.
Занимался ли кто-то кодированием,когда идет кодирование не по буквам,а целыми словами?
С учетом регистра и тд.
К примеру привет - 12odsja , Привет - 2394jOk.
В том виде, в котором ты это представляешь - это шифры, характерные для докомпьютерной эпохи
источник

YB

Yanis Benson in Distributed
u836
Сжатие добавит свои служебные маркеры, характерные для формата - заголовки файла, какие-то внутренние служебные метки и т.д., но не случайности.
Для сжатия вовсе не обязательны заголовки формата
источник

u

u836 in Distributed
Насколько мне известно любой пожатый текст имеет регулярную структуру, в зависимости от формата и распознать ее не так прям и сложно по характерным меткам, заголовкам, структурам, называйте как хотите
источник

KP

Kirill Pimenov in Distributed
u836
Насколько мне известно любой пожатый текст имеет регулярную структуру, в зависимости от формата и распознать ее не так прям и сложно по характерным меткам, заголовкам, структурам, называйте как хотите
Наоборот, с концептуальной точки зрения собственно сжатие — это дедупликация любых предсказуемых паттернов, и чем лучше мы это делаем тем меньше паттернов и закономерностей у нас есть в результате.
То есть идеально сжатый контент (без учёта заголовков и прочего, собственно контент) — неотличим от потока случайных чисел.
источник

KP

Kirill Pimenov in Distributed
На практике мы и близко не достигаем этого идеала.
источник

KP

Kirill Pimenov in Distributed
Но хотя бы посмотри на это так: если исходный текст — собственно текст, то в нём только печатные символы одного-двух алфавитов.
То есть далеко не все вариации битов в байте в нём вообще встречаются.
Если такой текст хорошенько сжать, то мы будем эффективнее использовать пространство доступных нам байтов, и встречаться будут любые биты-в-байте вообще.
источник