Size: a a a

OpenStreetMap RU

2020 October 09

f

fr1 in OpenStreetMap RU
там же и запустишь
источник

М

Макс in OpenStreetMap RU
XStream очень похож на то, что я хочу
источник

KK

Keks Keksov in OpenStreetMap RU
fr1
парсить xml регексом это дебилизм
Ничего ты в настоящем удовольствии не понимаешь! )))
источник

KK

Keks Keksov in OpenStreetMap RU
Был у меня как-то SED скрипт на 1000 строк...
источник

KK

Keks Keksov in OpenStreetMap RU
логи парсил
источник

KK

Keks Keksov in OpenStreetMap RU
Когда время обработки дошло до 10 минут, то переписал всё на bison и flex, время сократилось до 10 сек.
источник

М

Макс in OpenStreetMap RU
пфф. я перлом почти однострочником парсил логи и сразу в оракл заливал аггрегированные данные
источник

М

Макс in OpenStreetMap RU
только под виндой не работал, там какие-то ограничения на длинну строки вылезли :)
источник

ПЖ

Павел Жирнов... in OpenStreetMap RU
емнип ограничение длины строки в консоли линухи около 2 мб.
и некоторые в него упирались :)
источник

D

Dmitry in OpenStreetMap RU
Keks Keksov
Когда время обработки дошло до 10 минут, то переписал всё на bison и flex, время сократилось до 10 сек.
Тоже хочу попросить lxml больших объёмов (несколько гигабайт). Не пробовал Python+lxml?
источник

KK

Keks Keksov in OpenStreetMap RU
Dmitry
Тоже хочу попросить lxml больших объёмов (несколько гигабайт). Не пробовал Python+lxml?
Нет, увы...
источник

DV

Denis Voronin in OpenStreetMap RU
Макс
только под виндой не работал, там какие-то ограничения на длинну строки вылезли :)
я как-то разок разбирал такое художество... в голову лезли нехорошие мысли о средневековых казнях
источник

М

Макс in OpenStreetMap RU
Denis Voronin
я как-то разок разбирал такое художество... в голову лезли нехорошие мысли о средневековых казнях
такое проще заново написать, чем разбирать, я не дурной разбирать пелоскрипты
источник

DV

Denis Voronin in OpenStreetMap RU
ну там задача стояла подправить готовое
источник

d

danilshik in OpenStreetMap RU
Dmitry
Тоже хочу попросить lxml больших объёмов (несколько гигабайт). Не пробовал Python+lxml?
Я использую для парсинга сайтов =)
источник

d

danilshik in OpenStreetMap RU
Самый быстрый на Python для синтаксического анализа
источник

D

Dmitry in OpenStreetMap RU
danilshik
Я использую для парсинга сайтов =)
Для сайтов вроде Beautiful Soup 4 больше подходит. Я им парсю.
источник

d

danilshik in OpenStreetMap RU
Dmitry
Для сайтов вроде Beautiful Soup 4 больше подходит. Я им парсю.
в bs4 лучше ставить lxml =)
источник

d

danilshik in OpenStreetMap RU
Правда иногда он косячит, правда было пару раз
источник

d

danilshik in OpenStreetMap RU
тогда приходилось переключать на html5lib вроде в bs4
источник