Size: a a a

Python для анализа данных

2021 June 05

YA

Yuriy Anofelesoff in Python для анализа данных
Да-нет, осложнения в первом варианте да-нет, во втором варианте дополнительно по степени от 1 до 4
источник

АР

Александр Райков... in Python для анализа данных
в зависимости от ответов на эти вопросы может быть много чего - регрессионный, дисперсионный, ковариационный, дискриминантный, обобщённая линейная модель... Если есть какое-то количество выбывших из исследования (т.е. известно, что Вася через 2 года курения умер от рака, Петя курил 20 лет и живой, а Миша курил 2 года без рака, дальше его судьба теряется), то это вообще анализ выживания
источник

АР

Александр Райков... in Python для анализа данных
а курение и алкоголь про всех одновременно известны?
источник

АР

Александр Райков... in Python для анализа данных
первый вариант, если нужно учитывать одновременно факторы курения и алкоголя - чётко логлинейный анализ
источник

YA

Yuriy Anofelesoff in Python для анализа данных
Да для всех.
источник

АР

Александр Райков... in Python для анализа данных
второй вариант можно при желании обсчитать как дисперсионный, но шкала от 1 до 4 плохо дифференцирована, нормального распределения наверняка не даст и анализ выйдет с натяжками. Можно попробовать порядковую (Ordinal) регрессию
источник

YA

Yuriy Anofelesoff in Python для анализа данных
Спасибо
источник
2021 June 06

АМ

Алексей Макаров... in Python для анализа данных
Это что за ботошторм
источник
2021 June 07

АС

Алексей Сафонов... in Python для анализа данных
@ax_makarov тут немного спама завезли 😱
источник

А

Алексей in Python для анализа данных
коллеги, как etl инструменты чаще всего встречаете на практике?
источник

АМ

Алексей Макаров... in Python для анализа данных
SQL?😅
источник

А

Алексей in Python для анализа данных
ну как вариант :) но sql же этот не совсем инструмент, что-то должно запросы как минимум по расписанию запускать :)
источник

D

Darya in Python для анализа данных
Airflow
источник

АМ

Алексей Макаров... in Python для анализа данных
Или Luigi, если нужно что-то с меньшим порогом входа
источник

А

Алексей in Python для анализа данных
а pentaho у кого то встречался в проектах?
источник

А

Алексей in Python для анализа данных
по сравнению с AirFlow?
источник

ВL

Владислав Lazycat... in Python для анализа данных
Нет единого ответа на вопрос. Зависит от объема данных, в каком формате содержится, требуется ли очистка данных, архитектура решения, БЮДЖЕТ
Ну и т.д.
источник

ВК

Владимир Калинин... in Python для анализа данных
informatica, sys-пакеты
источник

AK

Alex K in Python для анализа данных
Народ, привет всем, вопросик, понять не могу, может кто-то подскажет

1 Почему я не могу распаковать такой вариант
2 Можно ли как-то без этой функции проверить наличие значения в индексе и вернуть строку при наличии или какого-то значения при отсутсвии. Какой-то аналог get

Пробовал так же b[['manager','club']], выдаёт NameError: name 'b' is not defined
источник

AK

Alex K in Python для анализа данных
такой вывод функции
источник