Некоторые алгоритмы не умеют работать с пропущенными значениями. И их заполняют каким-то отдельным значением, чтобы пропуски вынести в отдельную категорию. Бывает, что наличие пропуска само по себе несёт информацию. Если заполнить средним или медианой, может быть не так интересно