ну там просто разделение пула запросов на ядра, через import multiprocessing, добавлением пары строчек получаем что питон сам этим занимается, а мое дело для него функцию написать, которая обрабатывает одну url'ку
lxml не обязательно, можно заюзать скрапиевский Parsel, но если прям надо скорость-скорость, то можно и его, а вообще без разницы - у меня к примеру это был хром, помушо скрапи работать не хотел, даже со splash