Телеграмм чат группы pydata

10:53пожаловаться #1

СИ

Руслан Ахмадеев

Спасибо, вопрос решен.
Не досмотрел на стаковерфлоу

# эталонный рабочий запрос при 'Accept': 'application/xml'

xml = """
<a>d</a>
"""
    
headers = {
    'Content-Type': 'application/xml'
} # set what your server accepts

r = requests.post('http://httpbin.org/post', params=xml, headers=headers)

А, вы изначально params и headers не вставили?

10:53пожаловаться #2

СИ

Руслан Ахмадеев

И далее r.json() выдает нужный контент

Да пишите сразу .post.json

10:54пожаловаться #3

СИ

Сергей Ильин

Да пишите сразу .post.json

Ну, в смысле req.post(your params).json

Руслан Ахмадеев... in Python для анализа данных

10:55пожаловаться #4

РА

Сергей Ильин

А, вы изначально params и headers не вставили?

не, дело в этом куске

xml = """
<a>d</a>
"""

я пытался его вставить как словарь

10:56пожаловаться #5

СИ

Руслан Ахмадеев

не, дело в этом куске

xml = """
<a>d</a>
"""

я пытался его вставить как словарь

А, ок.

10:57пожаловаться #6

ND

Привет!
Подскажите, пожалуйста, как можно использовать apply для строк датасета, соответствующих опр. условиям? Или, возможно, какой-то другой вариант решения есть.
Есть датасет. Одно из полей a1 содержит неск. пропусков. Другое поле a2 содержит категории. Нужно заполнить пропуски в a1 внутри категорий - медианой по группам a2 (т.е. ds.groupby('a2')['a1'].median()) в случае, если эта медиана не превышает значения в поле a3 заполняемой строки. В противном случае пустое значение для a1 в строке заполнить значением из a3.

Alex Sumovsky in Python для анализа данных

20:17пожаловаться #7

AS

пишите функцию с параметром строка
в ней реализуете все условия с return'ами (на выход обязательно возвращаете строку)
и потом пишете ds.apply(функция, axis = 1)

Alex Sumovsky in Python для анализа данных

20:31пожаловаться #8

AS

ее еще можно протестировать удобно на каком-нибудь датафрейме, набитом руками

20:33пожаловаться #9

R

Я бы сделал отдельный столбец в котором рассчитал бы медианы. Далее можно попробовать написать df.apply(lAmbda x: x.median if x.a1.isna() and x.a3>x.medians) что то в таком духе. В синтаксисе неуверен но можно погуглить apply lambda pandas

20:35пожаловаться #10

ND

я правильно понимаю, что ф-ия у меня в итоге всегда будет применяться абсолютно ко всем строкам датасета? И нельзя сказать: " применить ф-ию только на этих строках, а на эти время не тратить"?

20:37пожаловаться #11

ND

Ruslan

Я бы сделал отдельный столбец в котором рассчитал бы медианы. Далее можно попробовать написать df.apply(lAmbda x: x.median if x.a1.isna() and x.a3>x.medians) что то в таком духе. В синтаксисе неуверен но можно погуглить apply lambda pandas

медианы, по идее, можно и в цикл в функции засунуть, категорий немного

20:38пожаловаться #12

R

Natalya Davydova

я правильно понимаю, что ф-ия у меня в итоге всегда будет применяться абсолютно ко всем строкам датасета? И нельзя сказать: " применить ф-ию только на этих строках, а на эти время не тратить"?

Если условие по строке выполняется то функция будет отрабатываться полностью. Если нет то произойдёт выход из функции на этапе проверки условия

20:39пожаловаться #13

R

Natalya Davydova

медианы, по идее, можно и в цикл в функции засунуть, категорий немного

Зачем? Создайте новый даьафрейм где посчитаете Медианы по категориям . Далее мердж и все столбец создан

20:40пожаловаться #14

R

Проще один раз сгруппировать чем писать цикл ну мне так кажется

20:41пожаловаться #15

ND

Ruslan

Если условие по строке выполняется то функция будет отрабатываться полностью. Если нет то произойдёт выход из функции на этапе проверки условия

если миллион строк и только 5 из них удовлетворяют условию, то проверки будут делаться на каждой строке (т.е. миллион раз) и для этих 5 функция отработает до конца?

20:41пожаловаться #16

R

Да все верно

20:42пожаловаться #17

R

Apply работает построечно