Добрый день коллеги, возникла проблема с извлечением текста из pdf, сейчас используется pdftotext (popler utils), суть проблемы в том, что при извлечении текста на некоторые страницы тратится 2-3 секунды (в то время как на некоторые другие по 5-8 мс), хотел уточнить, есть ли смысл искать узкое место в утилите и попробовать переписать парсер или проблема связана с самим документом pdf?
Обычно использую podofo в качестве парсера, poppler - только в качестве рендера, но я бы сначала попробовал понять чем отличаются сами документы, разброс уж слишком большой, такое на кривость кода не спишешь без веской причины.