Там есть еще неявная проблема. Голос явно синтезирован, причем тупо склейкой отдельно озвученных кусков, которые интонационно не согласованы.
Синтез речи - отдельная дисциплина. Кто серьезно занимается, отмечают странный спецэффект: человек вроде все слышит, но перестает улавливать смысл.
Это проявляется, например, в аудиокнигах, которые читает программа. В какой-то момент раз, и как отрезало. Слышишь речь, русскую, но не понимаешь.
Решается добавлением искажений, довольно непростым программированием эмоциональной окраски, свойственной речи человека.
Даже простейшую говорилку времени для гонок сделать очень непросто. Если нарезать числительные - будет выглядеть как текст вымогателя, нарезанный из разноцветных букв.
Когда слушал пример объявления, сознание точно так же выключилось. Это реально звуковой мусор.