Size: a a a

Python для анализа данных

2021 July 06

A

Andrey Denisov in Python для анализа данных
files = glob.glob('/gdrive/My Drive/Python/Data/XXX/*.xlsx') #забирает все файлы по маске из папки на Гдрайве - можно прописать локальную папку

df = pd.concat([pd.read_excel(fp, sheet_name = 0, header = 2).assign(Filename=os.path.basename(fp)) for fp in files]) # дфка с конкатом и новой колонкой с именем файлов
источник

A

Andrey Denisov in Python для анализа данных
Ну и сохранять дальше во что угодно
источник

А

Александр in Python для анализа данных
Спасибо, где то близко, но получаю такую ошибку:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xec in position 1: invalid continuation byte
источник

A

Andrey Denisov in Python для анализа данных
Ну текст ошибки прямо написан, можно немного погуглить
источник
2021 July 07

А

Александр in Python для анализа данных
Андрей наверное я не правильно объяснил, но нужно, что бы каждый файл сохранялся отдельно (их не нужно объединять в один).

test1.xsl>передали в переменную (df)>сохранили в test1.csv

Если есть возможность подскажи пожалуйста, как это можно реализовать?
источник

A

Andrey Denisov in Python для анализа данных
Если файлов много и нужно каждый пересохранять - цикл
Убрать объединение - грохнуть pd.concat

Я прислал рабочий пример, который был под рукой
источник

МК

Максим Коротченков... in Python для анализа данных
Мужики, нужна еще помощь, как можно интерпретировать результаты Ramdom Forest? если построить одно дерево, то правила построить несложно, но точность маленькая.
мне важно выудить правило из данных, которое позволит точно классифицировать бинарную выборку. Как это можно сделать?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Ничего не понятно.
Пытаетесь понять какие признаки random forest выбрал преимущественно ?
источник

МК

Максим Коротченков... in Python для анализа данных
источник

МК

Максим Коротченков... in Python для анализа данных
что- то вроде того, дерево же строит правило, и мне нужно понять какие правила строит random forest
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ну вот. теперь осталось в уме нарисовать сотню деревьев и выделить главное)
источник

МК

Максим Коротченков... in Python для анализа данных
и как это можно сделать не в уме?) есть идеи?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
дак никак, ведь считается что человек только  7 чисел может запомнить)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
источник

3

3ldar in Python для анализа данных
Погуглите shap. Мб, подойдёт
источник

МК

Максим Коротченков... in Python для анализа данных
спасибо, попробую
источник
2021 July 08

MK

M K in Python для анализа данных
У маргерштерна вышел новый альбом
источник

DB

Dmytro Buzanov in Python для анализа данных
Подскажите, пожалуйста, как можно предсказать значения целевой переменной за 1 месяц?
Например:
данные с 2010-01-01 по 2011-12-31 предсказывает January 2012,
данные с 2010-02-01 по 2012-01-31 предсказывает February 2012,
данные с  2019-05-01 по 2021-05-31 предсказывает June 2021

может есть полезные ссылки/рекомендации?
источник

AD

Alexander Dergilev in Python для анализа данных
имеется ввиду, прогноз сделать?
источник

DB

Dmytro Buzanov in Python для анализа данных
да
источник