Size: a a a

Python для анализа данных

2021 October 09

SS

Sergey Svetlov in Python для анализа данных
Можно так

f = lambda x: x.column_name.count() == 1
df.groupby(column_name).filter(f)
источник
2021 October 10

VM

Valerii Mamontov in Python для анализа данных
Я бы сделал так:


from collections import Counter

import pandas as pd

url = 'https://vk.com/doc207845555_611573740'
data = pd.read_csv(url, sep='\t')

ones = []
c = Counter(data['user_id'])
for k, v in c.items():
   if v == 1:
       ones.append(k)

data_ones = data[data['user_id'].isin(ones)]
print(data_ones.head())
источник

AO

Andrew Odegov in Python для анализа данных
Зачем так сложно, если можно просто drop_dudlicates применить?
источник

AO

Andrew Odegov in Python для анализа данных
df. drop_dudlicates(subset='первая колонка', keep=False)
источник

VM

Valerii Mamontov in Python для анализа данных
Согласен!))
источник

Р

Роджер in Python для анализа данных
Могу предложить работенку, кому надо?
источник

M

Mikhail in Python для анализа данных
Оставит уникальные строки, а не отфильтрует значения, которых больше одного
источник

AO

Andrew Odegov in Python для анализа данных
А разница в чём?
источник

M

Mikhail in Python для анализа данных
1, 2, 2, 3, 3, 3, 4
drop_duplicates оставит 1, 2, 3, 4
отфильтровать значения которых больше одного: 1, 4
источник

AO

Andrew Odegov in Python для анализа данных
нет
источник

AO

Andrew Odegov in Python для анализа данных
источник

M

Mikhail in Python для анализа данных
ааа, keep
тогда ок, да
источник

M

Mikhail in Python для анализа данных
не знал про этот аргумент
источник

AO

Andrew Odegov in Python для анализа данных
бывает)
источник

АР

Александр Райков... in Python для анализа данных
Крутой метод
источник
2021 October 11

Е

Елена in Python для анализа данных
Всем привет! Ребят подскажите пжл с Json
Структура
{"A":  
       {"title": "Наименование"
         "value": "Карандаш"...
},..
{"B":  
       {"title": "Город"
         "value": "Москва"...
},...
.
.

При нормализации пока получается:
A.tittle                     В.value          С.title      D.value    E.title  F.value
Наименование  Карандаш   Город     Москва   Цена     10
Наименование  Пенал            Город      Питер     Цена     15
Наименование  Ручка             Город      Самара   Цена    20

Как исправить, чтобы получилось:
Наименование | Город      |Цена
Карандаш            |Москва    |10
Пенал                      |Питер      |15  
Ручка                        |Самара   |20
источник

VP

Vladimir Popov in Python для анализа данных
Мне кажется проще всего пересоздать на этой основе DF
источник

VP

Vladimir Popov in Python для анализа данных
сейчас это в какой форме существует? датафрема?
источник

Е

Елена in Python для анализа данных
да
источник

VP

Vladimir Popov in Python для анализа данных
Очевидно, B, c, f мы сохраняем
источник