Вроде бы oom-killer считает приоритет процессов по количеству памяти, которая высвободится при прибитии процесса.
Я бы влепил node_exporter с '--collector.systemd --collector.processes', натравил на него прометея и смотрел бы на сервер через
https://grafana.com/grafana/dashboards/1860. Там каждые 10 секунд тотальный срез по серверу, включая статистику по процессам, iops-ам, прерываниям, коннектам и прочим кишочкам.