AP
Сегодня в с 8:40 по 10:15 в зоне доступности ru-central-b произошёл сбой оборудования одновременно на 4-х физических серверах. Инцидент затронул менее 1% физических дисков, расположенных в этой зоне доступности. Это крайне маловероятное событие, причины возникновения которого сейчас исследуются.
В Яндекс.Облаке данные хранятся на реплицированных сетевых дисках. Сетевой диск выдерживает одновременный отказ двух серверов без потери данных. В момент отказа сервера данные начинают реплицироваться на другие сервера. Но одновременный отказ 4-х серверов за такой короткий промежуток времени привел к тому, что не все данные успели реплицироваться. В результате этого часть данных на дисках оказалась потеряна.