Size: a a a

Python для анализа данных

2020 December 02

А

Алексей in Python для анализа данных
перед file1 = docx2txt.process(y) напишите print(y)
источник

@

@annykey in Python для анализа данных
ну в любом случае, он же должен выбирать только файлы .docx?
источник

А

Алексей in Python для анализа данных
Проверьте на всякий случай
источник

@

@annykey in Python для анализа данных
Алексей
перед file1 = docx2txt.process(y) напишите print(y)
выводит название файла
источник

@

@annykey in Python для анализа данных
ааа ) и выводит имя файла, которого нет в папке )) все, походу поняла, спасибо )
источник

VM

Valerii Mamontov in Python для анализа данных
при открытии файла система создает его временную копию с тем же расширением
открываем 123.docx
рядом создаётся ~$123.docx
в этом скорей всего и была проблема
источник

А

Алексей in Python для анализа данных
Valerii Mamontov
при открытии файла система создает его временную копию с тем же расширением
открываем 123.docx
рядом создаётся ~$123.docx
в этом скорей всего и была проблема
Скорее всего вчера неудачно закрылся файл и такая скрытая копия не была удалена. А по алфавиту она идёт выше чем этот файл.
Поэтому и казалось что он один и выдаёт ошибку...
источник

VM

Valerii Mamontov in Python для анализа данных
да, очевидно кто-то открыл файл руками
по идее модуль docx2txt не должен создавать временные файлы
источник

VM

Valerii Mamontov in Python для анализа данных
нужно просто добавить маску для файлов, чтобы исключить обработку временных файлов
источник

@

@annykey in Python для анализа данных
дада, все верно один файл открывался, собственно как и выяснилось, что регулярка не корректна была, не все данные выдергивала из одного файла.
источник

@

@annykey in Python для анализа данных
но я понятия не имела, что будут из-за этого проблемы )) пол дня потрачено...
источник

ND

Natalya Davydova in Python для анализа данных
Привет!
Подскажите, пожалуйста, я хочу заполнить пропуски медианным значением по сгруппированным данным.
median_dst = data.groupby('field1')['field2'].median() , результат группировки -
field1_value1  median1
field1_value2  median2
field1_value3  median3
В field2 надо заполнить пропуски на основе полученной в группе медианы, что-то типа такого (для первой строки):
data.loc[data['field1'] == field1_value1] = (data.loc[data['field1'] == field1_value1].fillna(
       value = {'field2': median1})
такое заполнение можно сделать только итерируясь по median_dst, или есть способ получше?
источник

ВК

Владимир Калинин... in Python для анализа данных
есть
источник

ВК

Владимир Калинин... in Python для анализа данных
transform
источник

ВК

Владимир Калинин... in Python для анализа данных
для данной задачи используйте метод transform
источник

ND

Natalya Davydova in Python для анализа данных
поняла, спасибо!
источник
2020 December 03

N5

NEKETOC 555 in Python для анализа данных
Привет.
источник

N5

NEKETOC 555 in Python для анализа данных
Получаю данные через сокеты в формате строки
однако есть код, который разбивает строку на словари и ключи, но не все работает, при выводе obj дает ошибку, без него выводит только дату . Однако может вывести только obj, если  без даты Вопрос к формированию данных для датасета. Вопрос, как сделать чтоб строку полностью разбивало на ключи и выводлся словарь в троку, т.к. словарь obj выводится в столбец.

while True:
   data = client.recv(1024)
   text = data.decode('utf-8')
   res = dict()

   pos = text.rfind(':')
   res['time'] = text[:pos]
   for data in text[pos + 1:].split(","):
       obj = data.split("=")
       #=res[obj[0]] = obj[1]
       print(obj)
      #print(res)
источник

N5

NEKETOC 555 in Python для анализа данных
пример строк
2020.12.03 03:06:40.519: Ask = 13296.0, Bid = 13294.0, Volume = 1, Last = 13294.0, Flag = 88, Volume Real = 1.0, Type = Sell, Spread = 20


2020.12.03 03:06:41.739: Ask = 13294.5, Bid = 13293.0, Volume = 1, Last = 13294.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 15


2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13295.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13296.0, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
источник

VM

Valerii Mamontov in Python для анализа данных
NEKETOC 555
пример строк
2020.12.03 03:06:40.519: Ask = 13296.0, Bid = 13294.0, Volume = 1, Last = 13294.0, Flag = 88, Volume Real = 1.0, Type = Sell, Spread = 20


2020.12.03 03:06:41.739: Ask = 13294.5, Bid = 13293.0, Volume = 1, Last = 13294.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 15


2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13295.5, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
2020.12.03 03:06:46.869: Ask = 13295.5, Bid = 13293.5, Volume = 1, Last = 13296.0, Flag = 56, Volume Real = 1.0, Type = Buy, Spread = 20
Здравствуйте. А какому виду хотите привести каждую строку?
источник