Там же вроде есть объяснение, что-то вроде: разные юниты не разбрасываются по ядрам, а собираются строго последовательно в одном потоке, что даёт этому потоку полный контроль над кодом и, соответственно, он может сделать те оптимизации, которые упустил бы, если бы юниты компиляции были разбросаны между ядрами ~равномерно, когда один крейт компилируется в одном месте, а другой - в другом.
Понял