Size: a a a

Machine learning

2020 May 17

ВП

Вячеслав Проскуряков... in Machine learning
Ребят. Я знаю, что в SQL русскоязычное и название с 2 значениями можно вызывать с кавычками. Как в Питоне это урегулировано, не знаете?
источник

RS

Ruslan Sabirov in Machine learning
Вячеслав Проскуряков
Ребят. Я знаю, что в SQL русскоязычное и название с 2 значениями можно вызывать с кавычками. Как в Питоне это урегулировано, не знаете?
dataframe['Id локации']
источник

n

novicer in Machine learning
Ruslan Sabirov
К сожалению, не работал с категориальными данными. Как вариант можно попробовать взять все комбинации категориальных фичей и применить кластеринг для каждой комбинации независимо.
1) а в чём профит такого подхода? мы ведь таким образом сможем только избавиться от категориальных данных в кластеризации, но взамен число классов вырастет слишком сильно... к примеру у меня есть категориальные данные, соответственно 2*4*5 ->40 вариантов. в итоге только на этом моменте у меня уже 40 кластеров, а я даже ещё не взялся кластеризировать... это точно не подойдёт
2) не, логическая составляющая моих данных не позволяет усомниться в том, что какой-то параметр можно опустить...
источник

ВП

Вячеслав Проскуряков... in Machine learning
Ruslan Sabirov
dataframe['Id локации']
источник

RS

Ruslan Sabirov in Machine learning
Без точки, как в словарях
источник

ВП

Вячеслав Проскуряков... in Machine learning
Всё, спасибо)
источник

MM

Max Max in Machine learning
источник

V

Valery in Machine learning
Они беееесконечны
источник

YK

Yura Korol in Machine learning
Повторно прошу помощи!
Смотрел в истории советы по этому заданию, но решения не нашёл (или не понял). Были советы использовать метод get, прочёл документацию по нему, но как к этому заданию применить - не понял. Читал доки по словарям, были задачи на подсчёт слов из файла, но это другое. Там нужно было выводить слова из файла в качестве ключей, а здесь слова должны быть значениями по ключам от 0 до n-1 слов.
источник

YK

Yura Korol in Machine learning
Переслано от Yura Korol
#C1W2, задание по сходству текстов.
Надо создать словарь из всех слов в тексте, проиндексированных от 0 до 1. Получается только набор словарей, элементы которых проиндексированы относительно длины своего списка. Как сделать один словарь? Не могу понять, как в цикле можно по-другому сделать.
источник

YK

Yura Korol in Machine learning
Переслано от Yura Korol
источник

YK

Yura Korol in Machine learning
Ещё из-за подготовки к экзаменам не успеваю к завтра сделать задачку по аппроксимации. (
источник

YK

Yura Korol in Machine learning
Так вот вопрос в том, как в цикле вывести один словарь, а не каждой строке по словарю. И как это добро присвоить переменной вне цикла.
источник

RS

Ruslan Sabirov in Machine learning
Yura Korol
Так вот вопрос в том, как в цикле вывести один словарь, а не каждой строке по словарю. И как это добро присвоить переменной вне цикла.
Я несколько раз перечитал сообщения, но не понял, что хочется в итоге. Можешь на конкретном примере написать?
источник

YK

Yura Korol in Machine learning
Условие задачи. )
источник

AK

Alex K in Machine learning
Здравствуйте. Делаю C2W3 и с ходу столкнулся с мистикой. Есть dataframe X, из которого нужно   получить два других: 1) где NaN заменены на средние по столбцам, 2) NaN заменены на 0. Создаю Xmeans = X и Xzeros = X. Потом делаю Xmeans[colname] = Xmeans[colname].fillna(meanvalue) для каждого столбца, Xzeros = Xzeros.fillna(0). Но в итоге и в Xmeans, и в Xzeros NaNы заполнятся одинаково - или нулями, или средними - в зависимости от того, какая операция раньше вызвана. Я бы еще понял, если бы fillna вообще не срабатывала, но как два разных датафрейма живут одной жизнью?? Они же не по ссылке обрабатываются, это же не какой нибудь вонючий Си :/
источник

🐙

🐙 in Machine learning
Alex K
Здравствуйте. Делаю C2W3 и с ходу столкнулся с мистикой. Есть dataframe X, из которого нужно   получить два других: 1) где NaN заменены на средние по столбцам, 2) NaN заменены на 0. Создаю Xmeans = X и Xzeros = X. Потом делаю Xmeans[colname] = Xmeans[colname].fillna(meanvalue) для каждого столбца, Xzeros = Xzeros.fillna(0). Но в итоге и в Xmeans, и в Xzeros NaNы заполнятся одинаково - или нулями, или средними - в зависимости от того, какая операция раньше вызвана. Я бы еще понял, если бы fillna вообще не срабатывала, но как два разных датафрейма живут одной жизнью?? Они же не по ссылке обрабатываются, это же не какой нибудь вонючий Си :/
Могу путать, но у dataframe должно быть что-то типа .copy() , ибо да, по ссылке.
источник

AO

Andrew Odegov in Machine learning
Не путаете, так и надо
источник

VZ

Valeriy Zubairov in Machine learning
Alex K
Здравствуйте. Делаю C2W3 и с ходу столкнулся с мистикой. Есть dataframe X, из которого нужно   получить два других: 1) где NaN заменены на средние по столбцам, 2) NaN заменены на 0. Создаю Xmeans = X и Xzeros = X. Потом делаю Xmeans[colname] = Xmeans[colname].fillna(meanvalue) для каждого столбца, Xzeros = Xzeros.fillna(0). Но в итоге и в Xmeans, и в Xzeros NaNы заполнятся одинаково - или нулями, или средними - в зависимости от того, какая операция раньше вызвана. Я бы еще понял, если бы fillna вообще не срабатывала, но как два разных датафрейма живут одной жизнью?? Они же не по ссылке обрабатываются, это же не какой нибудь вонючий Си :/
Ну вообще по ссылке и обрабатываются
источник

VZ

Valeriy Zubairov in Machine learning
Зачем хранить 300 копий одного и того же, если можно хранить ссылку на это место в памяти
источник