Size: a a a

2020 June 05

q

qwerty123 in pro.algorithms
источник

q

qwerty123 in pro.algorithms
Привет
Ребят, можете помочь пж, кто знает как делать?

Проверить гипотезу о равенстве числа значений меньших 1 k в выборках X и Y при уровне значимости.
источник

DK

Dmitry Kozyrev in pro.algorithms
Вроде первая ссылка в гугле содержит достаточно теории, чтобы понять, как это делать
источник

q

qwerty123 in pro.algorithms
Dmitry Kozyrev
Вроде первая ссылка в гугле содержит достаточно теории, чтобы понять, как это делать
Прикол в том, что мне именно "значений меньших 1 k" а я не понимаю как это сделать
источник

q

qwerty123 in pro.algorithms
И что это вообще
источник

DK

Dmitry Kozyrev in pro.algorithms
Надо уточнять формулировку у того, кто дал задание
источник

q

qwerty123 in pro.algorithms
Т.е выходит в мои выборки мне только то, что меньше 70 брать из выборок Х и У?
источник
2020 June 06

DZ

Dmitry Zvorygin in pro.algorithms
А где можно почитать про blooming filter(не путать с фильтром Блума)?
источник

DZ

Dmitry Zvorygin in pro.algorithms
Гугл находит пару статей и те читаются с трудом
источник

KK

Kirill Kaymakov in pro.algorithms
В гугл сколаре ищи
источник

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms
Dmitry Zvorygin
А где можно почитать про blooming filter(не путать с фильтром Блума)?
а что это вообще?
источник

DZ

Dmitry Zvorygin in pro.algorithms
Vladislav 🇺🇸🚜🇷🇺
а что это вообще?
Сам хз ))
источник

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms
а зачем тогда про него читать?)
источник

DZ

Dmitry Zvorygin in pro.algorithms
Есть такая задача: есть примерно 100 миллиардов записей, раскиданных примерно по миллиону файлов(csv). И надо уметь быстро отвечать на запросы вида - а в каких файлах встречаются записи у которых а колонке user_id значение 123456
источник

DZ

Dmitry Zvorygin in pro.algorithms
Можно выдавать ложноположительные результаты, а ложноотрицательные - нельзя
источник

DZ

Dmitry Zvorygin in pro.algorithms
Умные люди посоветовали почитать про этот фильтр
источник

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms
умные люди посоветовали как раз фильтр Блума, с которым ты не хочешь путать
источник

KK

Kirill Kaymakov in pro.algorithms
Так это и есть фильтр блума
источник

DZ

Dmitry Zvorygin in pro.algorithms
Тогда я плохо понимаю как его тут прикрутить
источник

DZ

Dmitry Zvorygin in pro.algorithms
Делать миллион фильтров по одному на каждый файл?
источник