Давид, а можно, пожалуйста, пример пары таких задач: основной и другой -- той с которой "трансфер".
Если основная -- это оценка значимости, то другая -- это что?
Основная - оценка значимости каждого токена в контексте. Первоначальная - например, классификация предложений или детекция парафраз.
Если аутпут основной задачи мало чувствителен к выкидыванию данного токена или к изменению его эмбеддинга на какой-нибудь случайный, этот токен можно считать незначимым.