Кто-нибудь применял на практике efficient transformers (которые для длинных последовательностей - longformer, bigbird, etc)? В каких задачах (кроме работы с ДНК/РНК) они действительно полезны и не обойтись разбиением на несколько небольших последовательностей и агрегацией?