Телеграмм чат группы pydata

при открытии файла система создает его временную копию с тем же расширением
открываем 123.docx
рядом создаётся ~$123.docx
в этом скорей всего и была проблема

источник

11:27пожаловаться #6

А

Алексей in Python для анализа данных

Valerii Mamontov

при открытии файла система создает его временную копию с тем же расширением
открываем 123.docx
рядом создаётся ~$123.docx
в этом скорей всего и была проблема

Скорее всего вчера неудачно закрылся файл и такая скрытая копия не была удалена. А по алфавиту она идёт выше чем этот файл.
Поэтому и казалось что он один и выдаёт ошибку...

источник

11:29пожаловаться #7

VM

Valerii Mamontov in Python для анализа данных

да, очевидно кто-то открыл файл руками
по идее модуль docx2txt не должен создавать временные файлы

источник

11:30пожаловаться #8

VM

Valerii Mamontov in Python для анализа данных

нужно просто добавить маску для файлов, чтобы исключить обработку временных файлов

источник

11:32пожаловаться #9

@

@annykey in Python для анализа данных

дада, все верно один файл открывался, собственно как и выяснилось, что регулярка не корректна была, не все данные выдергивала из одного файла.

источник

11:37пожаловаться #10

@

@annykey in Python для анализа данных

но я понятия не имела, что будут из-за этого проблемы )) пол дня потрачено...

источник

11:37пожаловаться #11

ND

Natalya Davydova in Python для анализа данных

Привет!
Подскажите, пожалуйста, я хочу заполнить пропуски медианным значением по сгруппированным данным.
median_dst = data.groupby('field1')['field2'].median() , результат группировки -

field1_value1  median1
field1_value2  median2
field1_value3  median3

В field2 надо заполнить пропуски на основе полученной в группе медианы, что-то типа такого (для первой строки):

data.loc[data['field1'] == field1_value1] = (data.loc[data['field1'] == field1_value1].fillna(
        value = {'field2': median1})

такое заполнение можно сделать только итерируясь по median_dst, или есть способ получше?

источник

22:40пожаловаться #12

ВК

Владимир Калинин... in Python для анализа данных

есть

источник

22:52пожаловаться #13

ВК

Владимир Калинин... in Python для анализа данных

transform

источник

22:52пожаловаться #14

ВК

Владимир Калинин... in Python для анализа данных

для данной задачи используйте метод transform

источник

22:52пожаловаться #15

ND

Natalya Davydova in Python для анализа данных

поняла, спасибо!

источник

22:53пожаловаться #16

2020 December 03

N5

NEKETOC 555 in Python для анализа данных

Привет.

источник

05:25пожаловаться #17

N5

NEKETOC 555 in Python для анализа данных

Получаю данные через сокеты в формате строки
однако есть код, который разбивает строку на словари и ключи, но не все работает, при выводе obj дает ошибку, без него выводит только дату . Однако может вывести только obj, если без даты Вопрос к формированию данных для датасета. Вопрос, как сделать чтоб строку полностью разбивало на ключи и выводлся словарь в троку, т.к. словарь obj выводится в столбец.

while True:
data = client.recv(1024)
text = data.decode('utf-8')
res = dict()

pos = text.rfind(':')
res['time'] = text[:pos]
for data in text[pos + 1:].split(","):
obj = data.split("=")
#=res[obj[0]] = obj[1]
print(obj)
#print(res)

источник

05:30пожаловаться #18

N5

NEKETOC 555 in Python для анализа данных

пример строк
2020.12.03 03:06:40.519: Ask = 13296.0, Bid = 13294.0, Volume = 1, Last = 13294.0, Flag = 88, Volume Real = 1.0, Type = Sell, Spread = 20

2020.12.03 03:06:41.739: Ask = 13294.5, Bid = 13293.0, Volume = 1, Last = 13294.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 15

2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13295.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13296.0, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20

источник

06:07пожаловаться #19

VM

Valerii Mamontov in Python для анализа данных

NEKETOC 555

пример строк
2020.12.03 03:06:40.519: Ask = 13296.0, Bid = 13294.0, Volume = 1, Last = 13294.0, Flag = 88, Volume Real = 1.0, Type = Sell, Spread = 20

2020.12.03 03:06:41.739: Ask = 13294.5, Bid = 13293.0, Volume = 1, Last = 13294.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 15

2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13295.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13296.0, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20

Здравствуйте. А какому виду хотите привести каждую строку?

источник

08:24пожаловаться #20