ID:0
Рубрика #мюсли
В очередной раз напоминаю подписчикам канала, что корреляция и причинно-следственная связь — это два разных понятия. Где есть корреляция, может и не быть причинно-следственной связи.
Можете сказать, конечно, что это и так всем очевидно и смысла нет в очередной раз это повторять. Но уже несколько раз мне пришлось напоминать про это различие в разговорах о корреляции уровня преступности с количеством людей из дискриминируемого меньшинства.
Аргументация выстраивается, например, следующим образом: в районах, где больше черных в США, больше преступности. Соответственно, нужно усилить надзор над черными в США и опасаться их — они с большей вероятностью попытаются нарушить закон.
Можно привести график количества преступлений с процентной частью черного населения в районе — и увидеть, что, да, так оно и есть: где больше черных, там и больше преступности. Но является ли это причинно-следственной связью или простой корреляцией с причиной где-то глубже?
Что, если на уровень преступности влияет не раса человека, а его достаток? Что, если чем беднее район — тем больше в нем преступности? Тогда есть вероятность, что экономическая дискриминация черных делает их беднее, что, в свою очередь, поднимает уровень преступности?
Возможно ли это? Конечно, да. Но эту причинно-следственную связь необходимо доказать перед принятием каких-либо социальных политик. Тем более, нужно доказать причинно-следственную связь либо между достатком и преступностью, либо между расой и преступностью. Именно причинно-следственную связь доказать, а не указать на простую корреляцию.
В следующий раз, когда услышите, что черные — преступники, спросите себя и собеседника, а может ли быть, что на поведение человека влияет не его раса, а достаток?
Тогда и разрушающие слоганы "утихомирим черных" превратятся в созидательные "искореним бедность". Чем богаче страна, тем меньше в ней преступности.
Кстати кому интересно, есть про причинно следственные связи раздел в статисике, называется Casual Inference. Книжки по теме: Casual Inference, The book of why, mastering metrics
P.S. сам не читал, думаю скоро за них взяться. Книжки вроде бы больше технические
Также рекомендую лекции с datafest (конфа по анализу данных)
https://ods.ai/tracks/causal-inference-in-ml-df2020 там также больше технические вещи, нужно знать статистику/эконометрику