Size: a a a

Python для анализа данных

2020 November 20

РА

Руслан Ахмадеев... in Python для анализа данных
И далее r.json() выдает нужный контент
источник

СИ

Сергей Ильин... in Python для анализа данных
Руслан Ахмадеев
Спасибо, вопрос решен.
Не досмотрел на стаковерфлоу

# эталонный рабочий запрос при 'Accept': 'application/xml'

xml = """
<a>d</a>
"""
   
headers = {
   'Content-Type': 'application/xml'
} # set what your server accepts

r = requests.post('http://httpbin.org/post', params=xml, headers=headers)
А, вы изначально params и headers не вставили?
источник

СИ

Сергей Ильин... in Python для анализа данных
Руслан Ахмадеев
И далее r.json() выдает нужный контент
Да пишите сразу  .post.json
источник

СИ

Сергей Ильин... in Python для анализа данных
Сергей Ильин
Да пишите сразу  .post.json
Ну, в смысле req.post(your params).json
источник

РА

Руслан Ахмадеев... in Python для анализа данных
Сергей Ильин
А, вы изначально params и headers не вставили?
не, дело в этом куске
xml = """
<a>d</a>
"""
я пытался его вставить как словарь
источник

СИ

Сергей Ильин... in Python для анализа данных
Руслан Ахмадеев
не, дело в этом куске
xml = """
<a>d</a>
"""
я пытался его вставить как словарь
А, ок.
источник

ND

Natalya Davydova in Python для анализа данных
Привет!
Подскажите, пожалуйста, как можно использовать apply для строк датасета, соответствующих опр. условиям? Или, возможно, какой-то другой вариант решения есть.
Есть датасет. Одно из полей a1  содержит неск. пропусков. Другое поле a2 содержит  категории. Нужно заполнить пропуски в a1 внутри категорий -  медианой по группам a2 (т.е. ds.groupby('a2')['a1'].median()) в случае, если эта медиана не превышает значения в поле a3 заполняемой строки. В противном случае пустое значение для a1 в строке заполнить значением из a3.
источник

AS

Alex Sumovsky in Python для анализа данных
пишите функцию  с параметром строка
в ней реализуете все условия с return'ами (на выход обязательно возвращаете строку)
и потом пишете ds.apply(функция, axis = 1)
источник

AS

Alex Sumovsky in Python для анализа данных
ее еще можно протестировать удобно на каком-нибудь датафрейме, набитом руками
источник

R

Ruslan in Python для анализа данных
Я бы сделал отдельный столбец в котором рассчитал бы медианы. Далее можно попробовать написать df.apply(lAmbda x: x.median if x.a1.isna() and x.a3>x.medians) что то в таком духе. В синтаксисе неуверен но можно погуглить apply lambda pandas
источник

ND

Natalya Davydova in Python для анализа данных
я правильно понимаю, что ф-ия у меня в итоге всегда будет применяться абсолютно ко всем строкам датасета? И нельзя сказать: " применить ф-ию только на этих строках, а на эти время не тратить"?
источник

ND

Natalya Davydova in Python для анализа данных
Ruslan
Я бы сделал отдельный столбец в котором рассчитал бы медианы. Далее можно попробовать написать df.apply(lAmbda x: x.median if x.a1.isna() and x.a3>x.medians) что то в таком духе. В синтаксисе неуверен но можно погуглить apply lambda pandas
медианы, по идее, можно и в цикл в функции засунуть, категорий немного
источник

R

Ruslan in Python для анализа данных
Natalya Davydova
я правильно понимаю, что ф-ия у меня в итоге всегда будет применяться абсолютно ко всем строкам датасета? И нельзя сказать: " применить ф-ию только на этих строках, а на эти время не тратить"?
Если условие по строке выполняется то функция будет отрабатываться полностью. Если нет то произойдёт выход из функции на этапе проверки условия
источник

R

Ruslan in Python для анализа данных
Natalya Davydova
медианы, по идее, можно и в цикл в функции засунуть, категорий немного
Зачем? Создайте новый даьафрейм где посчитаете Медианы по категориям . Далее мердж и все столбец создан
источник

R

Ruslan in Python для анализа данных
Проще один раз сгруппировать чем писать цикл ну мне так кажется
источник

ND

Natalya Davydova in Python для анализа данных
Ruslan
Если условие по строке выполняется то функция будет отрабатываться полностью. Если нет то произойдёт выход из функции на этапе проверки условия
если миллион строк и только 5 из них удовлетворяют условию, то проверки будут делаться на каждой строке (т.е. миллион раз) и для этих 5 функция отработает до конца?
источник

R

Ruslan in Python для анализа данных
Да все верно
источник

R

Ruslan in Python для анализа данных
Apply работает построечно
источник

R

Ruslan in Python для анализа данных
Построчно
источник

ND

Natalya Davydova in Python для анализа данных
если условия сложные, а сет большой, может дорого получиться =\
источник