Size: a a a

Python для анализа данных

2021 December 02

VM

Valerii Mamontov in Python для анализа данных
источник

VM

Valerii Mamontov in Python для анализа данных
Может отсутствующая дата - причина ошибки?
источник

А

Анонимус in Python для анализа данных
🤦‍♂️реально. Я на саму дату даже не посмотрел, спасибо.
источник

3

3ldar in Python для анализа данных
ylim, если ещё актуально)
источник

AL

Anastasia L in Python для анализа данных
Добрый день, вопрос новичка, почему, когда я делаю замену таким образом, датафрейм перестает быть датафреймом
источник

3

3ldar in Python для анализа данных
Вы присваиваете изначальному df_database_1 всего одну колонку из него? Если так и нужно, оберните ‘sourceMedium’ в ещё одни квадратные скобки
источник

AL

Anastasia L in Python для анализа данных
нет мне просто в колонке нужно значение заменить, датафрейм должен остаться прежним
источник

3

3ldar in Python для анализа данных
Тогда нужно не df_database_1 присваивать а df_database_1[‘sourceMedium’]
источник

AL

Anastasia L in Python для анализа данных
так а у меня как
источник

3

3ldar in Python для анализа данных
Ну или можно без присваивания обойтись с inplace’ом
источник

AL

Anastasia L in Python для анализа данных
разве не так же
источник

3

3ldar in Python для анализа данных
Нет)
Посмотрите внимательно:
У вас идёт df_database_1 = …
А нужно df_database_1[‘sourceMedium’] = …
источник

AL

Anastasia L in Python для анализа данных
ааааа
источник

AL

Anastasia L in Python для анализа данных
поняла ((( спасибо большое, не подумала, это первая операция с датфреймом, которую я пыталась провести ))) еще rename и query остались😂
источник

3

3ldar in Python для анализа данных
источник

М

Максим in Python для анализа данных
Привет всем.
У меня есть DF с около 1млн строк примерно такого содержания:

df = pd.to_dataframe(data={
"col_1":[1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5],
"col_2":["a", "b", "a", "b", "a", "b", "c", "d", "a", "b", "c", "d", "c", "d"]
})
Нужно оставить такой результат. Убрать повторяющиеся вхождения.
df_res = pd.to_dataframe(data={
"col_1":[1, 2, 3, 4, 5],
"col_2":["a", "b", "c", "d", np.nan]
})

Подскажите пожалуйста, как можно это сделать?
источник

AG

Arsen Gumin in Python для анализа данных
df[‘col1’].unique()?
источник

AG

Arsen Gumin in Python для анализа данных
А, нужно ещё для тех кого меньше nan
источник

М

Максим in Python для анализа данных
В общем у меня есть id - это col_1 и к ним подтянуты транзакции - это col_2.
Задача к каждой col_1 оставить одну транзакцию, при этом транзакция не должна упоминаться 2 раза
источник

AG

Arsen Gumin in Python для анализа данных
Так может ты мерж неправильно просто сделал?)
источник