Видел много вариантов в ствтьях :)
Для транскриптома я сам использую 5-10 псевдо-каунтов (Salmon + tximport) на ген, но зависит от задачи и данных.
Для дифференциациальной экспрессии можно использовать Deseq2 apeglm, который в принципе не требует предварительной фильтрации.
спасибо, а почему именно 5-10 каунтов? просто по опыту?
да, в принципе Deseq2 и использовался потом, только там выбрасываются только совсем пустые гены, а с маленькими количеством каунтов остаются, что потом влияет как на нормализацию, так и на дальнейший РСА...