Size: a a a

Regular Expressions

2020 July 30

A

Alexander in Regular Expressions
лучше описать задачу
источник

A

Alexander in Regular Expressions
что на входе, что на выходе
источник

A

Alexander in Regular Expressions
чем больше тем лучше
источник

A

Alexander in Regular Expressions
и по возможности логику
источник

A

Alexander in Regular Expressions
пока я понимаю нужно выделять все вхождения guid ?
источник

EK

Evgeny Kuchkov in Regular Expressions
на входе любой хтмл
на выходе хочу массив из msg_id
msg_id могут быть в любом формате, но чаще всего попадают под [a-z0-9-]{30,40}
ложные срабатывания бывают когда в тексте попадаются разделители типа —————————
источник

EK

Evgeny Kuchkov in Regular Expressions
поэтому первое что пришло на ум это выпиливать слова где идут подряд два даша
источник

OM

Oleg Makarikhin in Regular Expressions
Evgeny Kuchkov
на входе любой хтмл
на выходе хочу массив из msg_id
msg_id могут быть в любом формате, но чаще всего попадают под [a-z0-9-]{30,40}
ложные срабатывания бывают когда в тексте попадаются разделители типа —————————
а система - это язык программирования общего назначния, или только регекспы?
источник

EK

Evgeny Kuchkov in Regular Expressions
пхп
источник

EK

Evgeny Kuchkov in Regular Expressions
поэтому вот так
$_msgid_regex = "@(?! .*--)([a-z0-9-]{30,40})@";
preg_match_all($_msgid_regex, $_contents, $_msgid);
источник

EK

Evgeny Kuchkov in Regular Expressions
можно было конечно предварительно $_contents обрабатывать, но я решил запихнуть всё в один регексп
источник

A

Alexander in Regular Expressions
Evgeny Kuchkov
на входе любой хтмл
на выходе хочу массив из msg_id
msg_id могут быть в любом формате, но чаще всего попадают под [a-z0-9-]{30,40}
ложные срабатывания бывают когда в тексте попадаются разделители типа —————————
еще примеры есть видов msg id?
источник

EK

Evgeny Kuchkov in Regular Expressions
бывают еще такие 0A74ABE2
источник

EK

Evgeny Kuchkov in Regular Expressions
но их никак не отловишь
источник

A

Alexander in Regular Expressions
ты просто больше примеров вывали
источник

EK

Evgeny Kuchkov in Regular Expressions
loc_5de81499-134b-1f58-33b3-10df92431494-1-VLB
70a8f0ca6a00fed4
beac18131618a524
675A326C
2-155342155
3daed71c
gran-369d1dab-fb05b93f
источник

EK

Evgeny Kuchkov in Regular Expressions
ну вот бегло чекнул логи, выделил в основном такого вида
источник

OM

Oleg Makarikhin in Regular Expressions
а в строке всегда есть MSG_ID ?
источник

EK

Evgeny Kuchkov in Regular Expressions
нет
источник

OM

Oleg Makarikhin in Regular Expressions
я в пхп неумею, но там просто обязаны быть html-парсеры (убрать теги), и потом разбить сообщение по пробелу и применять регексп на "слова"
источник