Телеграмм чат группы ChatAssembler страница 1213

2020 March 03

AB

Artöm Bakri Al-Sarmini in Ассемблер

Операция > возвращает 0 или 1, в момент входа в функцию в eax может лежать что угодно

источник

10:18пожаловаться #1

L

Leon in Ассемблер

Artöm Bakri Al-Sarmini

int add_overflows(int lhs, int rhs) {
    return lhs + rhs > lhs;
}

add_overflows:
        xor     eax, eax
        test    esi, esi
        setg    al
        ret

Не понимаю кодген. При каком условии сработает setg?

Компайлер просто редуцировал lhs + rhs > lhs в rhs > 0 что логично

источник

10:49пожаловаться #2

楽

楽園松本 in Ассемблер

Leon

Компайлер просто редуцировал lhs + rhs > lhs в rhs > 0 что логично

А зачем xor eax, eax?

источник

10:51пожаловаться #3

L

Leon in Ассемблер

楽園松本

А зачем xor eax, eax?

Потому что в конце он al меняет. Во первых убрать возможный мусор а во вторых операции с 8битными регистрами уже с п-про и выше давали задержку в несколько тактов изза особенностей внутренних, ее модно было избежать предварительно обнулив весь большой регистр.

источник

10:57пожаловаться #4

楽

楽園松本 in Ассемблер

Leon

Потому что в конце он al меняет. Во первых убрать возможный мусор а во вторых операции с 8битными регистрами уже с п-про и выше давали задержку в несколько тактов изза особенностей внутренних, ее модно было избежать предварительно обнулив весь большой регистр.

Я правильно понял, что если операция с r8, то она будет выполняться быстрее, если r32 обнулить?

источник

11:05пожаловаться #5

AB

Artöm Bakri Al-Sarmini in Ассемблер

楽園松本

Я правильно понял, что если операция с r8, то она будет выполняться быстрее, если r32 обнулить?

Нулить нужно старшие биты

источник

11:10пожаловаться #6

AB

Artöm Bakri Al-Sarmini in Ассемблер

А по скорости не знаю

L

Да

楽

楽園松本 in Ассемблер

Leon

Да

Это ответ на какую реплику?

источник

11:28пожаловаться #9

L

Leon in Ассемблер

楽園松本

Это ответ на какую реплику?

На эту

источник

11:28пожаловаться #10

L

Leon in Ассемблер

楽園松本

Я правильно понял, что если операция с r8, то она будет выполняться быстрее, если r32 обнулить?

Вот

источник

11:29пожаловаться #11

楽

楽園松本 in Ассемблер

Leon

Потому что в конце он al меняет. Во первых убрать возможный мусор а во вторых операции с 8битными регистрами уже с п-про и выше давали задержку в несколько тактов изза особенностей внутренних, ее модно было избежать предварительно обнулив весь большой регистр.

Откуда инфа? Для меня это новость.

Такое вполне может быть, но как-то очень радикально выглядит идея. Идея, что процессор выбирает последовательность микрокоманд на основе предыдущих данных.

источник

11:29пожаловаться #12

L

Leon in Ассемблер

楽園松本

Откуда инфа? Для меня это новость.

Такое вполне может быть, но как-то очень радикально выглядит идея. Идея, что процессор выбирает последовательность микрокоманд на основе предыдущих данных.

Зубков если правильно помню

источник

11:31пожаловаться #13

L

Leon in Ассемблер

Это началось в пентиум про и врядли прекратилось. Надо глянуть Интелловские доки актуально ли еще

источник

11:32пожаловаться #14

楽

楽園松本 in Ассемблер

Leon

Это началось в пентиум про и врядли прекратилось. Надо глянуть Интелловские доки актуально ли еще

Ну вот я не помню такого в доках. Хотя, такие вещи вряд ли поместят в доки. Это уже уровень внутренней инфы.

источник

11:34пожаловаться #15

L

Leon in Ассемблер

楽園松本

Ну вот я не помню такого в доках. Хотя, такие вещи вряд ли поместят в доки. Это уже уровень внутренней инфы.

Надо глянуть optimization manual

источник

11:35пожаловаться #16

L

Leon in Ассемблер

источник

12:17пожаловаться #17

L

Leon in Ассемблер

Во. Немножко наврал. Не операции с 8битными давали задержку а операции с 32битными после 8битных.

источник

12:17пожаловаться #18

L

Leon in Ассемблер

так, судя по этому, https://software.intel.com/sites/default/files/managed/9e/bc/64-ia-32-architectures-optimization-manual.pdf раздел 3.5.2.4 Partial Register Stalls последние поколения с этим получше справляются особенно начиная с сандика. но все равно оптимальнее занулить регистр вначале.

источник

12:36пожаловаться #19

L

Leon in Ассемблер

А амдэшныхдоках просто пишут avoid 😄 и все

источник

12:47пожаловаться #20