docx как и xlsx могут открываться архиваторами. Возможно и библиотека открывает их как архив, а потом по известной структуре обрабатывает файлы... Если doc переименовать в docx то Word вроде отработает, но библиотека может споткнуться и написать ошибку что это не архив. Что и случилось. Как это проверить: Открыть вордом и пересохранить как docx (на всякий случай под другим именем). Оставить только новый файл. Если без ошибок, значит переименовали файл.
Если расширение файла doc насильно переименовать в docx, то будет docx и ворд откроет норм. И будет казаться что это docx. Только c 2007 офиса майкрософт сменили структуру файлов. И получается что файл старого формата выдаёт себя за файл нового формата.
А точно проблема с открытием файла? Может там проблема тогда в регулярке? Перед и после строки с регуляркой выведите текст в принте что бы понять где ошибка. В открытии файла или регулярке...