И чтобы сделать вывод на экран ещё более прямым и быстрым, сейчас есть вещи типа flip model swap chain в DXGI, DirectComposition. Польза от отрисовки окна на CPU сейчас есть, наверно, только тогда, когда у тебя Windows 7 с выключенным Aero (то есть, с темой без прозрачных стекляшек), хотя, не знаю, как оно там внутри работает даже. Или на XP, может быть. А GUI на GPU сейчас рисуется, если его делать на WPF, а не на WinAPI