Или dummy. Я так и не понял это одно и тоже или разное )
По сути и там, и там кодирование категориального признака происходит через создание бинарных признаков. По уму, конечно, такое кодирование всегда должно предполагать создание n-1 бинарных признаков, где n — кол-во категорий. Это нужно для того, чтобы в данных не появлялась строгая мультиколлинеарность.
На практике же чистые линейные модели используют редко, как правило всегда навешивается сверху регуляризация, которая в свою очередь убирает эффект неединственности оценок, который наступает в случае этой самой строгой мультиколлинеарности, и поэтому на n-1 признаков, грубо говоря, забивают и вводят n бинарных. Хотя это, конечно, некрасивый подход