Size: a a a

Python для анализа данных

2021 July 19

АР

Александр Райков... in Python для анализа данных
Если там есть линейная комбинация при наличии большего числа строк, чем столбцов, то должны выйти единицы на нужном и нули на остальном
источник

АР

Александр Райков... in Python для анализа данных
Если нет линейной комбинации, в данном вопросе можно вообще дальше не смотреть. Знач строка отчета как-то принципиально иначе формируется
источник

АР

Александр Райков... in Python для анализа данных
Это бухгалтерия, а не прогнозирование, здесь ничего, кроме докопеечного соответствия не надо
источник

DZ

Daniel Zaharov in Python для анализа данных
Вчера решил в итоге, спасибо)
источник

LK

Lyubov K. in Python для анализа данных
Всем привет! Подскажите можно как-то строку разбить сразу в датафрейм?
источник

A

Andrey Denisov in Python для анализа данных
Можно. По разделителям. Регулярка
источник

LK

Lyubov K. in Python для анализа данных
Я пробовала такие регулярки писать site="(.+?)" , server="(.+?)"
источник

LK

Lyubov K. in Python для анализа данных
Но мне кажется можно проще как-то?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
А что они сразу в json не пишут?
источник

LK

Lyubov K. in Python для анализа данных
Нет( Архив gz, а в нем текстовик
источник

A

Andrey Denisov in Python для анализа данных
Сперва нужно понять какие данные - можно их по разделителю в лоб или регулярка
Если регуляркой не получилось - плохая регулярка
источник

LK

Lyubov K. in Python для анализа данных
А можно пример. Как регуляркой сразу все разделить, а не таскать по одному полю.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Я не спросил записано или не записано. Я сообщил, что они могут писать сразу в json.
источник

A

Andrey Denisov in Python для анализа данных
1. Нужно посмотреть свои данные - есть ли там вообще что-то, что можно разделить - т.е. какой-то общий паттерн, что-то повторяющееся
2. Если есть - можно ли отделать обычным сепаратором (на уровне источника задать правильный сепаратор)
3. Если сепаратор есть и он сложный - то регуляркой. Лично я для удобства пользуюсь этим https://regex101.com/

Ну или как озвучил Павел - изначально всё складывать максимально правильно
источник

LK

Lyubov K. in Python для анализа данных
Нет, не могут
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Они врут.
источник

LK

Lyubov K. in Python для анализа данных
Возможно, но с этим не могу ничего сделать, к сожалению.
источник

LK

Lyubov K. in Python для анализа данных
Буду пробовать. Спасибо!
источник

VM

Valerii Mamontov in Python для анализа данных
можно примерно так:
import pandas as pd

data_list = [['agent="zabbix" src="34345" user="anonymous" ip="127.1.1.1"'],
            ['agent="zabbix" src="89899" user="user1" ip="127.0.1.1"'],
            ['agent="zabbix" src="81279" user="guest" ip="127.0.0.1"']]

data_dict = {}

for text in data_list:
   for dd in text[0].split(" "):
       key, value = dd.split("=")
       value = value.replace('"', '')
       
       value_list = data_dict.get(key, [])
       value_list.append(value)
       data_dict[key] = value_list

df = pd.DataFrame(data_dict)
df

или так:
data = 'agent="zabbix" src="34345" user="anonymous" ip="127.1.1.1"'

data_dict = {dd.split('=')[0]: [dd.split('=')[1]]
                   for dd in data.split(' ')}

df = pd.DataFrame(data_dict)
df
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Коллеги, кто работает с временными рядами, можете подсказать кое что по моделям ARMA? Боюсь, что не совсем корректно их интерпретирую и использую. Если кому не трудно, хотел бы пообщаться в личке
источник