Да вот я тоже на DOM API смотрю, но неужели нет хорошей либы, чтобы вот прям удобная, мне бы посмотреть на API такое разок. XPATH / JSONPath смахивают на дичь...
я думаю что тут надо смотреть в сторону DSL, потому что все что ты указал - это по сути сериализуемая операция над поддеревом или нодой, а то что ты хочешь это модификация дерева по каким-то детерминированным правилам, а значит и сами правила - будут иерархическими. Проще говоря библиотек нет, то что ты описал ну это visitor сделает, пройдется по дереву уберет в определенных нодах что-то