VS
Size: a a a
VS
VS
VS
VS
VS
AA
ls -1 /sys/devices/system/edac/mc/mc0/csrow1/
ce_count
ch0_ce_count
ch0_dimm_label
ch1_ce_count
ch1_dimm_label
ch2_ce_count
ch2_dimm_label
ch3_ce_count
ch3_dimm_label
dev_type
edac_mode
mem_type
power
size_mb
subsystem
ue_count
uevent
ue_count
и ce_count
? Я просто когда-то при добавлении проверки делал так: grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
, т.е. смотрел чуть другое. Или это в принципе одно и тоже?VS
ls -1 /sys/devices/system/edac/mc/mc0/csrow1/
ce_count
ch0_ce_count
ch0_dimm_label
ch1_ce_count
ch1_dimm_label
ch2_ce_count
ch2_dimm_label
ch3_ce_count
ch3_dimm_label
dev_type
edac_mode
mem_type
power
size_mb
subsystem
ue_count
uevent
ue_count
и ce_count
? Я просто когда-то при добавлении проверки делал так: grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
, т.е. смотрел чуть другое. Или это в принципе одно и тоже?VS
DS
uname -aНа сервере запущено довольно много сервисов (Elasticsearch, впн, докер (storage driver - aufs) контейнеры с сервисами). Сервер жил не тужил до недавнего времени. Периодически (за 2 недели это второе падение) он стопается наглухо. Есть скриншот call trace при первом падении .
Linux 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt20-1+deb8u1 (2015-12-14) x86_64 GNU/Linux
22:20
сервер упал (отрапортовала система мониторинга + плюс отсутствие метрик с этого периода)22:32
(писались логи докера, типа kernel: docker0: port 15(veth63b10e9) entered disabled state
)22:20
- по метрикам никаких аномалий нету (метрики хоста, контейнеров, эластика). Сервер выполняет чисто служебные роли (на sata-диски конечно идет высокая нагрузка на запись из-за эластика, но так уже живем несколько лет (это только при мне, а так мб и дольше))V
GG
УП
YD
DS
V