Size: a a a

2020 October 15

К

Кирилл in Scrapy
Семён Трояновский
ну короче моя теория что "выбрала" в итоге именно публика из биг дата, которая писала на питоне и не хотела менять язык
Странно такое слышать, потому что скрапинг в биг дата это черновая работа, которую можно и обезьяне доверить, поэтому скорее всего серьезным дядям которые занимаются математикой и научной деятельностью всё равно кто им данные поставляет и откуда они их берут
источник

i

i in Scrapy
я час назад линк кидал)
источник

i

i in Scrapy
Семён Трояновский
можно примеры?
источник

К

Кирилл in Scrapy
Andrii
Fast (>1k request/sec on a single core) 🙄
Это много или мало?
источник

СТ

Семён Трояновский... in Scrapy
Кирилл
Странно такое слышать, потому что скрапинг в биг дата это черновая работа, которую можно и обезьяне доверить, поэтому скорее всего серьезным дядям которые занимаются математикой и научной деятельностью всё равно кто им данные поставляет и откуда они их берут
Хз, в курсы по биг дата однако стабильно вставляют раздел "парсинг данных"
источник

К

Кирилл in Scrapy
Это для нубов самоучек. В фирмах где есть разделение труда конечно это разные люди будут делать
источник

СТ

Семён Трояновский... in Scrapy
ну короче ладно ребят, я может чего-то упустил но когда я начинал реально все туториалы, все видосы, вся инфа была по scrapy или bs4, дальше этого врягаться не буду)
источник

МС

Михаил Синегубов... in Scrapy
Семён Трояновский
Хз, в курсы по биг дата однако стабильно вставляют раздел "парсинг данных"
Я в строительном институте получил корочку каменщика (это обязательно было). Это что получается, стандарт для строительства - кирпичный дом? 🤔 И каждый каменщик - инженер-строитель?
источник

СТ

Семён Трояновский... in Scrapy
Кирилл
Это для нубов самоучек. В фирмах где есть разделение труда конечно это разные люди будут делать
Какие-то вроде и на скрапи работают, но много где свои решения
источник

СТ

Семён Трояновский... in Scrapy
я сам не на питоне пишу 🤷‍♂
источник

СТ

Семён Трояновский... in Scrapy
но например на C# из общедоступного ничего даже близкого к scrapy нет
источник

СТ

Семён Трояновский... in Scrapy
Htmlagilitypack чтобы htmlки парсить и все
источник

СТ

Семён Трояновский... in Scrapy
Все остальное пиши сам
источник

A

Andrii in Scrapy
Так сделай
источник

i

i in Scrapy
Семён Трояновский
Htmlagilitypack чтобы htmlки парсить и все
источник

СТ

Семён Трояновский... in Scrapy
Andrii
Так сделай
так речь то о готовом решении омг
источник

i

i in Scrapy
вроде даже есть пара проектов, где не так все печально по звездам и датам
источник

СТ

Семён Трояновский... in Scrapy
чот несерьёзно
источник

i

i in Scrapy
ну хз, 2.7к звезд, имхо пойдет: https://github.com/dotnetcore/DotnetSpider
источник

i

i in Scrapy
фу, скобочки
источник