Size: a a a

Python для анализа данных

2021 January 22

МS

Мariia Smirnova in Python для анализа данных
Alex K
тогда nan надо использовать
Где?
источник

AK

Alex K in Python для анализа данных
как я понимаю, и мне потом по ним иттерироваться проще когда два столбца и не разделены. Тк я их потом использую
источник

AK

Alex K in Python для анализа данных
погоди не понял. Тип первый df где 6 столбцов, и из него сделать где 2?
источник

R

Romk in Python для анализа данных
Alex K
привет всем
можно как-то проще из листов создать df pandas чтоб у данных из каждого листа было отдельное поле с его старым названием?
а они у вас одинаковой длины или разной?
источник

AK

Alex K in Python для анализа данных
Romk
а они у вас одинаковой длины или разной?
Разной
источник

МS

Мariia Smirnova in Python для анализа данных
Alex K
погоди не понял. Тип первый df где 6 столбцов, и из него сделать где 2?
Не, сделать один датафрейм с 6 столбцами (ширина и долгота кфс, ширина и долгота мака, ширина и долгота бк)
источник

AK

Alex K in Python для анализа данных
Мariia Smirnova
Не, сделать один датафрейм с 6 столбцами (ширина и долгота кфс, ширина и долгота мака, ширина и долгота бк)
сс ними так в дальнейшем неудобно раотать и она разной длинны
источник

R

Romk in Python для анализа данных
Alex K
Разной
import random
import pandas as pd

kfc = [[random.random()*100 for i in range(10)]]
bk = [[random.random()*100 for i in range(20)]]
mc = [[random.random()*100 for i in range(15)]]

records = list(zip(['kfc'] * len(kfc[0]), kfc[0])) + \
         list(zip(['bk']*len(bk[0]), bk[0])) + \
         list(zip(['mc']*len(mc[0]), mc[0]))

df = pd.DataFrame.from_records(records, columns=['data', 'rest'])

может так?
источник

ЕО

Егор Овчинников... in Python для анализа данных
Скажите, а как вы подбираете гиперпараметры модели? GridSearch и Randomized?
источник

R

Romk in Python для анализа данных
Alex K
Разной
columns только перепутаны.. надо columns=['rest', 'data']
источник

МS

Мariia Smirnova in Python для анализа данных
Егор Овчинников
Скажите, а как вы подбираете гиперпараметры модели? GridSearch и Randomized?
Нейронки или из sklearn?
источник

ЕО

Егор Овчинников... in Python для анализа данных
Неее... Не нейронки)
источник

AK

Alex K in Python для анализа данных
Romk
import random
import pandas as pd

kfc = [[random.random()*100 for i in range(10)]]
bk = [[random.random()*100 for i in range(20)]]
mc = [[random.random()*100 for i in range(15)]]

records = list(zip(['kfc'] * len(kfc[0]), kfc[0])) + \
         list(zip(['bk']*len(bk[0]), bk[0])) + \
         list(zip(['mc']*len(mc[0]), mc[0]))

df = pd.DataFrame.from_records(records, columns=['data', 'rest'])

может так?
чо т мозга не хватает, но выглядит соизмеримо с моим вариантов в общем-то. Наверное не надо ничего мне меняять)
источник

МS

Мariia Smirnova in Python для анализа данных
Егор Овчинников
Неее... Не нейронки)
Я GridSearchCV использую
источник

ЕО

Егор Овчинников... in Python для анализа данных
Кто-то знаю через циклами перебирает... Есть еще библиотеки для этого... Думал, может кто юзает...
источник

МS

Мariia Smirnova in Python для анализа данных
Егор Овчинников
Кто-то знаю через циклами перебирает... Есть еще библиотеки для этого... Думал, может кто юзает...
Гридсерч по сути тоже перебор, но если для гиперпараметров есть специальные либы, интересно послушать)
источник

ЕТ

Евгений Томилов... in Python для анализа данных
Егор Овчинников
Скажите, а как вы подбираете гиперпараметры модели? GridSearch и Randomized?
Мрачные генетические алгоритмы и байесовский подбор. Но это всё равно всё гридсёрч, просто со свистелками.
источник

ЕО

Егор Овчинников... in Python для анализа данных
И еще... Я вот совсем новичок в этом деле, мне интересно и важно ваше мнение....если после валидации вы получаете неудоволетворительные результаты качества модели... Что вы делаете? Опишите первые 3 шага.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ухты, оказывается не все так просто как видео на ютубе с заранее подходящим датасетом. кто бы мог подумать!
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
И еще... Я вот совсем новичок в этом деле, мне интересно и важно ваше мнение....если после валидации вы получаете неудоволетворительные результаты качества модели... Что вы делаете? Опишите первые 3 шага.
https://ru.wikipedia.org/wiki/CRISP-DM
смотри, есть некая методология.
источник