Size: a a a

2020 September 26

AR

Andrey Rahmatullin in Scrapy
либо вы опять путаете данные и их представление
источник

G

Georgiy in Scrapy
https://pastebin.com/9vFL7kfQ
Единственное, что пришло в голову:
1.взять из исключения позицию в строке где обнаружен json.decoder.JSONDecodeError
2.если где то рядом есть " - то заменить на '.
3.запустить json.loads с измененной строкой
повторять пункты 1-3 в цикле пока не получим dict.
источник

A

Andrii in Scrapy
Кстати тож проблема с ДЖЕЙСОНОМ, не могу загрузить https://www.1800contacts.com/api/content/FAQs
источник

ПА

Павел Асеев... in Scrapy
Подскажите, а каким способом делается замена в item с помощью regex? Аналог .replace только с использованием regex
источник

К

Кирилл in Scrapy
Павел Асеев
Подскажите, а каким способом делается замена в item с помощью regex? Аналог .replace только с использованием regex
Замена чего?
источник

ПА

Павел Асеев... in Scrapy
Например из текста <p.*?> на <p> и т.д. Ну это как пример.
источник

E

EFS in Scrapy
Павел Асеев
Подскажите, а каким способом делается замена в item с помощью regex? Аналог .replace только с использованием regex
.sub
источник

i

i in Scrapy
Andrii
Кстати тож проблема с ДЖЕЙСОНОМ, не могу загрузить https://www.1800contacts.com/api/content/FAQs
ощущение, что там и не json, или я просто что-то не знаю про интернет
источник

ПА

Павел Асеев... in Scrapy
EFS
.sub
Спасибо огромное.
источник

К

Кирилл in Scrapy
re.sub делает реплейс по регулярке https://docs.python.org/3/library/re.html#re.sub
Но если ты работаешь с html то лучше использовать инструменты для html
источник

i

i in Scrapy
Andrii
Кстати тож проблема с ДЖЕЙСОНОМ, не могу загрузить https://www.1800contacts.com/api/content/FAQs
какой-то xml что-ли https://i.imgur.com/UuD3pCs.png
источник

AR

Andrey Rahmatullin in Scrapy
ну вы жжоте
источник

i

i in Scrapy
кек
источник

ПА

Павел Асеев... in Scrapy
Кирилл
re.sub делает реплейс по регулярке https://docs.python.org/3/library/re.html#re.sub
Но если ты работаешь с html то лучше использовать инструменты для html
Какие инструменты для HTML?
источник

AR

Andrey Rahmatullin in Scrapy
Andrii
Кстати тож проблема с ДЖЕЙСОНОМ, не могу загрузить https://www.1800contacts.com/api/content/FAQs
а как ты его из хмл выковыривал?
источник

К

Кирилл in Scrapy
Павел Асеев
Какие инструменты для HTML?
Например lxml или bs4
источник

i

i in Scrapy
как он нинаю. я так выковырял навскидку:
z = xmltodict.parse(response.text, process_namespaces=False)
j = json.loads(z['ContentDetails']['Content'])
print(j)
источник

AR

Andrey Rahmatullin in Scrapy
ну вот, а он видимо регексами
источник

A

Andrii in Scrapy
Andrey Rahmatullin
а как ты его из хмл выковыривал?
Regex'om
источник

AR

Andrey Rahmatullin in Scrapy
ну я и говорю
источник