всем привет!)
кто нибудь работал с pdf файлами, а именно - с чтением из pdf файла?
пример задачи: есть страница в браузере, либо вордовский документ, либо эксель, либо что угодно еще, с заранее известной мне разметкой (например сначала идет абзац текста, потом таблица 5х5, потом картинка, и тд). Эти данные экспортируются в pdf файл. Мне нужно считать данные из этого файла, и интерпретировать их, загнав данные из файла в память приложения (таблицу в двумерный массив и т.п., при этом информация должна быть читабельной, как изначальные файлы, а не зашифрованной)
Я потенциально готова изобретать велосипед и обшаривать документацию по структуре пдф файла.
Подозреваю что есть готовые библиотеки для этого, и также подозреваю что они очень платные (я уже бегло смотрела на доки по структуре файла и понимаю почему)) )
Насколько сложная эта задача?