Делаешь cpuid и rdtsc, сохраняешь значения, потом твой код который нужно померить, потом снова cpuid и rdtsc. Вычисляешь разницу.
Если кода не слишком много - имеет смысл повторить его между изменениями пару сотен тысяч раз, иначе разница будет на уровне статистической погрешности