А почему вы для такого случая выбираете Алису, а не сайт или telegram, например? Или настройка - в алисе с экраном, а дальше уже управление голосом на устройствах без экрана?
А для настроек нужны картинки?
Второй вариант, да. Настройка с клавиатуры, а дальше голосом. В моем случае для настроек не нужны картинки, но нужен ввод и просмотр длинных URL