Телеграмм чат группы scrapy

как он нинаю. я так выковырял навскидку:
z = xmltodict.parse(response.text, process_namespaces=False)
j = json.loads(z['ContentDetails']['Content'])
print(j)

Неделя прошла это раз, два - этот xmltodict я кинул как пример, я его вообще в первый раз видел, можно, наверное, и на xml.etree сделать, хто ж мешает, ну и без json там не особо обойтись. Разве что лично моя рекомендация - использовать вместо него orjson, быстрее будет. А для стандартной либы пишут большой варнинг, что она " module is not secure against maliciously constructed data", я бы поостерегся.

источник

17:41пожаловаться #5

i

i in Scrapy

прикольное название атаки "billion laughs", хех

источник

17:42пожаловаться #6

i

i in Scrapy

Сайт то сохранился, можете тоже играться: https://www.1800contacts.com/api/content/FAQs

источник

17:44пожаловаться #7

✏d

✏️ Oleksandr dntPani... in Scrapy

i

Неделя прошла это раз, два - этот xmltodict я кинул как пример, я его вообще в первый раз видел, можно, наверное, и на xml.etree сделать, хто ж мешает, ну и без json там не особо обойтись. Разве что лично моя рекомендация - использовать вместо него orjson, быстрее будет. А для стандартной либы пишут большой варнинг, что она " module is not secure against maliciously constructed data", я бы поостерегся.

этот варнинг уже года пол висит

источник

17:44пожаловаться #8

i

i in Scrapy

Предлагать лучшие решения, потом еще прогнать по таймингу, что быстрее работает)

источник

17:44пожаловаться #9

AR

Andrey Rahmatullin in Scrapy

где ж пол когда он и на 2.7 и 3.2 висит

источник

17:45пожаловаться #10

i

i in Scrapy

мое предложение пока такое (заменил json на orjson):
import orjson
z = xmltodict.parse(response.text, process_namespaces=False)
j = orjson.loads(z['ContentDetails']['Content'])
print(j)

источник

17:47пожаловаться #11

✏d

✏️ Oleksandr dntPani... in Scrapy

скажите лутчше, как получить из спайтдера настройки прокси для стороннего requests

источник

17:47пожаловаться #12

AR

Andrey Rahmatullin in Scrapy

если спайдер их взял из енвваров то взять оттуда же

источник

17:48пожаловаться #13

AR

Andrey Rahmatullin in Scrapy

а если нет то что там за настройки такие и где?

источник

17:48пожаловаться #14

i

i in Scrapy

отправляем на академика королева дом 12 (ну или в этот чат) другие решения и потом проводим тесты, что быстрее отрабатывает и насколько,

источник

17:48пожаловаться #15

✏d

✏️ Oleksandr dntPani... in Scrapy

в енварменте роайтинг прокси, который берет их из бд склайт

источник

17:48пожаловаться #16

✏d

✏️ Oleksandr dntPani... in Scrapy

i

отправляем на академика королева дом 12 (ну или в этот чат) другие решения и потом проводим тесты, что быстрее отрабатывает и насколько,

там сайт странный, джсон возвращет или хмл - по настроению

источник

17:49пожаловаться #17

i

i in Scrapy

там браузер в респонсе видит json, видать браузер шибко вумный, реквестс же питоновый получает стандартный xml (внутри поля которого лежит json)

источник

17:51пожаловаться #18

AR

Andrey Rahmatullin in Scrapy

Accept передайте, правда мне прошлый раз не помогло

источник

17:51пожаловаться #19

i

i in Scrapy

да и сайт тоже на самом деле xml получает This XML file does not appear to have any style information associated with it. The document tree is shown below.

источник

17:51пожаловаться #20