Телеграмм чат группы ru_devops страница 6272

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DevOps

1217 membersпожаловаться на группу

2020 February 04

VS

Vladimir Smirnov in DevOps

поэтому имеет смысл составить список тех, кого ты подозреваешь на дубликаты, а потом прочитать

источник

19:56пожаловаться #1

VS

Vladimir Smirnov in DevOps

условно ты можешь прочитать первые несколько кбайт, последние несколько кбайт и например в середине и уже с большой вероятностью сказать одинаковые файлы или нет, а для подозрительно похожих - поблочно сравнить целиком

источник

19:57пожаловаться #2

GG

George Gaál in DevOps

Vladimir Smirnov

условно ты можешь прочитать первые несколько кбайт, последние несколько кбайт и например в середине и уже с большой вероятностью сказать одинаковые файлы или нет, а для подозрительно похожих - поблочно сравнить целиком

+++++

источник

20:00пожаловаться #3

ЕО

Евгений Омельченко in DevOps

Vladimir Smirnov

условно ты можешь прочитать первые несколько кбайт, последние несколько кбайт и например в середине и уже с большой вероятностью сказать одинаковые файлы или нет, а для подозрительно похожих - поблочно сравнить целиком

Я бы делал так:
1. Посмотрел размеры всех файлов
2. Сгруппировал
3. Пробежался, для каждой группы:
* если в ней пара файлов, то сразу бы сравнивал их
* если больше пары, то сначала чексумма, а потом для совпавших сравнение на равенство

источник

20:13пожаловаться #4

GG

George Gaál in DevOps

Мд5сумма коллеге все равно нужна

источник

20:13пожаловаться #5

GG

George Gaál in DevOps

Для минимальной проверки целостности файлов на той стороне после передачи дистриба

источник

20:14пожаловаться #6

VS

Vladimir Smirnov in DevOps

Евгений Омельченко

Я бы делал так:
1. Посмотрел размеры всех файлов
2. Сгруппировал
3. Пробежался, для каждой группы:
* если в ней пара файлов, то сразу бы сравнивал их
* если больше пары, то сначала чексумма, а потом для совпавших сравнение на равенство

Чексумма все равно читает весь файл. Если файлов разумное колличество, быстрее сразу сравнить

источник

20:14пожаловаться #7

GG

George Gaál in DevOps

Но вообще выглядит будто коллегу спасли бы архивы рар мультивольюм с избыточной инфой

источник

20:14пожаловаться #8

GG

George Gaál in DevOps

Но хз

источник

20:14пожаловаться #9

ЕО

Евгений Омельченко in DevOps

Vladimir Smirnov

Чексумма все равно читает весь файл. Если файлов разумное колличество, быстрее сразу сравнить

Ну нет, для четырёх файлов уже неразумно

источник

20:14пожаловаться #10

VS

Vladimir Smirnov in DevOps

Мд5сумма коллеге все равно нужна

Ну так да, в целом можно и зная что за файлы можно ещё делать предположения

источник

20:14пожаловаться #11

ЕО

Евгений Омельченко in DevOps

Евгений Омельченко

Ну нет, для четырёх файлов уже неразумно

Это ж 6 сравнений

источник

20:15пожаловаться #12

GG

George Gaál in DevOps

Вообще реально задача для м
Собеса

источник

20:15пожаловаться #13

GG

George Gaál in DevOps

В девопс джобс

источник

20:15пожаловаться #14

VS

Vladimir Smirnov in DevOps

Евгений Омельченко

Это ж 6 сравнений

Ну для рассчета суммы тебе надо прочитать столько же но вместо сравнения делать математику над каждым

источник

20:16пожаловаться #15

VS

Vladimir Smirnov in DevOps

А так можно прочитать 4 блока, сравнить, выкинуть все файлы что не имеют совпадений, продолжить читать оставшиеся по блокам

источник

20:17пожаловаться #16

VS

Vladimir Smirnov in DevOps

Если ты предполагаешь что у тебя среди равных по размеру файлов маловероятно будут совпадения, то лучше сразу сравнивать

источник

20:17пожаловаться #17

ЕО

Евгений Омельченко in DevOps

Vladimir Smirnov

Ну для рассчета суммы тебе надо прочитать столько же но вместо сравнения делать математику над каждым

Ну там не такая уж жуткая математика. Но вообще можно начать попарные сравнения и одновременно, если файлов в группе больше 3, считать чексуммы

источник

20:18пожаловаться #18

VS

Vladimir Smirnov in DevOps

В целом если у него нет чексумм и ему надо из посчитать все равно, тогда да, возможно можно сначала по чексумма сравнить

источник

20:18пожаловаться #19

ЕО

Евгений Омельченко in DevOps

Vladimir Smirnov

Если ты предполагаешь что у тебя среди равных по размеру файлов маловероятно будут совпадения, то лучше сразу сравнивать

Ну, можно предполагать, что у них начало одинаковое

источник

20:19пожаловаться #20