Тут, мне кажется, будут дополнительные временные затраты. Попробую запрашивать выделять памяти на 3 байта больше, а там уже выравнивать указатель по необходимости
Тут я вижу заполнение некоего буфера, библиотечных функций не видать. Та что принимает uint32_t * скорее всего тоже вылетит по выравниванию если ей Ваше 0x4000CC65 передать