Size: a a a

Python для анализа данных

2021 February 23

KM

Konstantin Mohov in Python для анализа данных
Инплейс - бэд практик.
источник

A

Aleksey in Python для анализа данных
Я знаю доку и понимаю смысл аргументов. Использовать inplace аргумент в целом плохой стиль, т.к. пандас тяготит к выстраиванию цепочек вычислений. Если вернуться к примеру выше, то inplace=True будет полностью аналогичен df.columns = *какие-то поля*. С другой стороны, никто не мешает написать (только какой смысл) df = df.set_axis(columns=*bla bla bla*), т.е. без inplace, но изменения все равно сохранили.
источник

D

Dima🐼 in Python для анализа данных
Konstantin Mohov
Инплейс - бэд практик.
почему
источник

3

3ldar in Python для анализа данных
Aleksey
Я знаю доку и понимаю смысл аргументов. Использовать inplace аргумент в целом плохой стиль, т.к. пандас тяготит к выстраиванию цепочек вычислений. Если вернуться к примеру выше, то inplace=True будет полностью аналогичен df.columns = *какие-то поля*. С другой стороны, никто не мешает написать (только какой смысл) df = df.set_axis(columns=*bla bla bla*), т.е. без inplace, но изменения все равно сохранили.
Вы сами делаете оговорку, что это удобнее для chaining. Но задающий вопрос об этом вообще ничего не говорил. А если же попробует совместить inplace с чейнингом, то сразу же получит ошибку, так что не вижу смысла это обсуждать — inplace можно юзать)
Далее скину ссылку, где обсуждается, почему хорошо/плохо: https://stackoverflow.com/questions/45570984/in-pandas-is-inplace-true-considered-harmful-or-not
источник

A

Aleksey in Python для анализа данных
3ldar
Вы сами делаете оговорку, что это удобнее для chaining. Но задающий вопрос об этом вообще ничего не говорил. А если же попробует совместить inplace с чейнингом, то сразу же получит ошибку, так что не вижу смысла это обсуждать — inplace можно юзать)
Далее скину ссылку, где обсуждается, почему хорошо/плохо: https://stackoverflow.com/questions/45570984/in-pandas-is-inplace-true-considered-harmful-or-not
Вы можете юзать что угодно и как угодно, я вам не могу запретить) Можно и трусы через голову надевать. Вопрос был про inplace, как по мне - этот аргумент не стоит ставить ни в одном pandas методе в True. Единственный профит от этого аргумента в True - экономия памяти за счет переиспользования старых данных. Но вот беда, никаких гарантий нет. И если уж прикрепили ссылку, прочтите её. Там даже в ответе выделено "In general, there no performance benefits to using inplace=True".
источник

KM

Konstantin Mohov in Python для анализа данных
Dima🐼
почему
Во-первых все явное лучше неявного. Инплейс неявный.
Во-вторых при обработке данных нельзя менять исходный датасет с данными , все операции должны быть вынесены в отдельные явные датасеты. То есть в общем счете инплейс приводит к запутанности , и говнокоду.
источник

3

3ldar in Python для анализа данных
Aleksey
Вы можете юзать что угодно и как угодно, я вам не могу запретить) Можно и трусы через голову надевать. Вопрос был про inplace, как по мне - этот аргумент не стоит ставить ни в одном pandas методе в True. Единственный профит от этого аргумента в True - экономия памяти за счет переиспользования старых данных. Но вот беда, никаких гарантий нет. И если уж прикрепили ссылку, прочтите её. Там даже в ответе выделено "In general, there no performance benefits to using inplace=True".
А я заявлял обратное?)
источник

3

3ldar in Python для анализа данных
Зачем-то начали обсуждать, хорош или плох inplace. Текст по ссылке я, естественно, прочитал)
источник

KM

Konstantin Mohov in Python для анализа данных
Просто в интернете опять был кто-то не прав 🤣🤣
источник

A

Aleksey in Python для анализа данных
источник
2021 February 24

AK

Alex K in Python для анализа данных
Konstantin Mohov
Во-первых все явное лучше неявного. Инплейс неявный.
Во-вторых при обработке данных нельзя менять исходный датасет с данными , все операции должны быть вынесены в отдельные явные датасеты. То есть в общем счете инплейс приводит к запутанности , и говнокоду.
Получается и перезапись df в сам себя лучше не делать? Тип сброс индекса и тд ещё пойдет, но resample например уже не очень?
источник

AK

Alex K in Python для анализа данных
Народ, ещё интересно ваше мнение. Согласны ли что например с Джуна до мидла(а может и дальше) быстрее вырастешь, когда ходишь в офис где вокруг коллеги, чем на удалёнке?
источник

БЕ

Борис Евдеев... in Python для анализа данных
Alex K
Народ, ещё интересно ваше мнение. Согласны ли что например с Джуна до мидла(а может и дальше) быстрее вырастешь, когда ходишь в офис где вокруг коллеги, чем на удалёнке?
Зависит ещё от коллег. А так скорее да.
источник

KM

Konstantin Mohov in Python для анализа данных
Alex K
Получается и перезапись df в сам себя лучше не делать? Тип сброс индекса и тд ещё пойдет, но resample например уже не очень?
Да, верно.
источник

YM

Yura Markov in Python для анализа данных
Добрый день! Подскажите пожалуйста есть ли в питоне пакет для рисования графиков с доверительными интервалами скоректированные для внутри групповых дизайнов (например в R есть такое summarySEwithin)?
источник

AK

Aleksei Komissarov in Python для анализа данных
boxplot? Вторую часть ("скоректированные для внутри групповых дизайнов)" пока не понял
источник

YM

Yura Markov in Python для анализа данных
вот в этой статье есть описание http://pcl.missouri.edu/sites/default/files/morey.2008.pdf . Но если кратко то межгрупповые дизайны дают большие доверительные интервалы, а внутригрупповые засчет того что одни и теже люди проходят все условия дают меньшие доверительные интвервалы
источник

IS

Ivan Samorukov in Python для анализа данных
Всем привет! Подскажите, пожалуйста, как исключить из df_7 все строки, где дата пересекается с выборкой из датафрейма wells.

Drop не принимает список дат почему-то. Циклом проходиться как-то тупо. Есть что-то из встроенных методов?
источник

A

Andrey Denisov in Python для анализа данных
merge, потом loc?
источник

AK

Aleksei Komissarov in Python для анализа данных
источник