Size: a a a

Python для анализа данных

2020 November 29

A

Alexander in Python для анализа данных
Slavik
Можно добавить колонку id  через резет индекс
Нужно чтобы в каждом регионе с одного начинались id
источник

A

Alexander in Python для анализа данных
типа row number с окном по региону
источник

A

Alexander in Python для анализа данных
Alexander
Подскажите, пжлста, как внутри каждого региона присвоить ид всем округам от 1?
Если кому понадобится, cumcount поможет
источник
2020 November 30

PZ

Pavel Zheltouhov in Python для анализа данных
Как пользоваться библиотекой facebook prophet, если ты лузер ?
они правда это не учли ? что-то не могу нагуглить
источник

YP

Yuriy Prudnikov in Python для анализа данных
Почему ты просто не поменяешь местами cup и floor?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ой да. чет затупил
источник

PZ

Pavel Zheltouhov in Python для анализа данных
источник

s

ssv in Python для анализа данных
Как ощущения от пропета?)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
чисто побаловаться. мне это не нужно, тут вообще не эконометрический процесс. ну теперь я это понял.
источник

AS

Alexey Seleznev in Python для анализа данных
всем привет, подскажите плз как через selemium вот на этом сайте (https://halykbank.kz/exchange-rates) выбрать нужное значение в выпадающем списке


т.е. мне надо выбрать "для юридических лиц"
http://img.netpeak.ua/alsey/160673815363_kiss_12kb.png
источник

AS

Alexey Seleznev in Python для анализа данных
Открыть его вот так у меня получается, а как установить нужное значение пока не понимаю

driver.get('https://halykbank.kz/exchange-rates') 

list = driver.find_element_by_css_selector("body > div.wrapper > div > main > div > div.exchange_rates__wrap > div.select-group > div.select-sm.form-group > div.choices > div.choices__inner > div > div")
list.click()
источник

VL

Victor Laputsky in Python для анализа данных
Alexey Seleznev
Открыть его вот так у меня получается, а как установить нужное значение пока не понимаю

driver.get('https://halykbank.kz/exchange-rates') 

list = driver.find_element_by_css_selector("body > div.wrapper > div > main > div > div.exchange_rates__wrap > div.select-group > div.select-sm.form-group > div.choices > div.choices__inner > div > div")
list.click()
Алексей, привет!

у меня получилось провернуть операцию следующим образом:

data = driver.find_element_by_xpath("//div[@class='choices__inner']") - находим выпадающий список по наименованию класса
data.click() - кликаем
data = driver.find_element_by_xpath("//div[@id='choices--fmig-item-choice-2']") - находим в выпадающем списке элемент по id (отсортированы по порядку, choice-1 -  динамика, choice-2 - по карточкам, choice-3 - кросс-курсы, choice-4 - для юрлиц, choice-5 - для частников
data.click() - снова кликаем
источник

AS

Alexey Seleznev in Python для анализа данных
Victor Laputsky
Алексей, привет!

у меня получилось провернуть операцию следующим образом:

data = driver.find_element_by_xpath("//div[@class='choices__inner']") - находим выпадающий список по наименованию класса
data.click() - кликаем
data = driver.find_element_by_xpath("//div[@id='choices--fmig-item-choice-2']") - находим в выпадающем списке элемент по id (отсортированы по порядку, choice-1 -  динамика, choice-2 - по карточкам, choice-3 - кросс-курсы, choice-4 - для юрлиц, choice-5 - для частников
data.click() - снова кликаем
спасибо большое сейчас буду пробовать, ещё находил инфу о том что через класс Selector это удобнее сделать, но у меня ничего всё равно не получилось
источник

АМ

Алексей Макаров... in Python для анализа данных
Ребят, а понакидайте своих мыслей от чего ещё стоит предостерегать (в особенности новичков) при написании pandas-кода

https://t.me/datalytx/449
Telegram
Datalytics
Начал собирать для студентов Практикума список вредных советов при написании pandas-кода. Вот что делать НЕ стоит:

- Выводить датафрейм через функцию print() вместо display()
- Использовать built-in функции Python вместо методов pandas (например, sum(df['column']) вместо df['column'].sum())
- Использовать параметр inplace при вызове методов
- Удалять колонки через del
- Изменять названия колонок через атрибут columns или метод set_axis()
- Вызывать колонки через attribute-like запись (df.genre) вместо dict-like записи (df['genre'])
- Делать однотипные операции с колонками не через цикл, а каждую на своей строке
- Использовать пробелы, кириллицу и спецсимволы (напр. '$') в названиях колонок
- Проходится циклом по строкам датафрейма
- Использовать метод merge() без параметров how и on
- Это вкусовщина: использовать вызов методов из библиотеки, а не из инстанса DataFrame (например, pd.pivot_table() вместо df.pivot_table())
- Тоже вкусовщина: делать поочередные манипуляции с одной и той же колонкой на отдельных…
источник

s

ssv in Python для анализа данных
Может лучше написать как надо, чек как не надо?) или это в противовес бест практикз-бест фейлз ))
источник

s

ssv in Python для анализа данных
Я бы добавил - юзайте генераторы.
источник

ND

Natalya Davydova in Python для анализа данных
чтобы юзать генераторы, надо понимать, что такое итераторы и генераторы, что они дают) Тогда уж сразу - кортежи вместо списков там, где возможно, сеты там,  где это уместно. Но это надо python тогда поглубже копать. Словари, списки, кортежи - уместность использования для разных нужд.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
А method chaining экономит память и работает как бы внутри генератора, если я использую cross join, который слишком много лишних элементов продуцирует?
источник

OO

Oleg Omelchenko in Python для анализа данных
Алексей Макаров
Ребят, а понакидайте своих мыслей от чего ещё стоит предостерегать (в особенности новичков) при написании pandas-кода

https://t.me/datalytx/449
Telegram
Datalytics
Начал собирать для студентов Практикума список вредных советов при написании pandas-кода. Вот что делать НЕ стоит:

- Выводить датафрейм через функцию print() вместо display()
- Использовать built-in функции Python вместо методов pandas (например, sum(df['column']) вместо df['column'].sum())
- Использовать параметр inplace при вызове методов
- Удалять колонки через del
- Изменять названия колонок через атрибут columns или метод set_axis()
- Вызывать колонки через attribute-like запись (df.genre) вместо dict-like записи (df['genre'])
- Делать однотипные операции с колонками не через цикл, а каждую на своей строке
- Использовать пробелы, кириллицу и спецсимволы (напр. '$') в названиях колонок
- Проходится циклом по строкам датафрейма
- Использовать метод merge() без параметров how и on
- Это вкусовщина: использовать вызов методов из библиотеки, а не из инстанса DataFrame (например, pd.pivot_table() вместо df.pivot_table())
- Тоже вкусовщина: делать поочередные манипуляции с одной и той же колонкой на отдельных…
вот хорошее видео об оформлении кода в ноутбуках https://www.youtube.com/watch?v=yXGCKqo5cEY
источник

АМ

Алексей Макаров... in Python для анализа данных
🙏
источник