Size: a a a

2020 January 17

E

EgorBo in pro.net
CreateScalarUnsafe быстрее бродкаста (т.к. он просто запихивает скаляр в первый слот и похуй что там за остальные значения)
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
_mm256_unpacklo_epi8(ascii, _mm256_setzero_si256())
источник

E

EgorBo in pro.net
хм
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
а, тьфу, тут DE в первый пойдёт
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
unpacklo_epi8(unpacklo_epi8(ascii >> 4, ascii & 0xF) , 0)
источник

E

EgorBo in pro.net
Vitaliy ◀️TriΔng3l▶️ Kuzmin
unpacklo_epi8(unpacklo_epi8(ascii >> 4, ascii & 0xF) , 0)
ща попробую спс
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
А если в UTF-32, то потом занулить верхние 16 бит через unpacklo_epi16 с нулём
источник

E

EgorBo in pro.net
ну мне в шарп строку, она двухбайтовая
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
EgorBo
ща попробую спс
bswapни для начала только
источник

E

EgorBo in pro.net
@Triang3l а ascii — это вектор с одним интом? или бродакстенным?
источник

E

EgorBo in pro.net
и » 4, — это же по epi32 ?
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
EgorBo
@Triang3l а ascii — это вектор с одним интом? или бродакстенным?
Не ASCII, а BCD, точнее. Одним интом, в остальных лейнах нули
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
EgorBo
и » 4, — это же по epi32 ?
По epi8, чтобы по очереди закидать нижние 4 бита и верхние 4 бита отдельно в 8-битные лейны
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
0xDE -> 0x0D, 0x0E, потом 0x0D, 0x0E -> 0x0E0D, 0x0000
источник

E

EgorBo in pro.net
а есть такая операция?
источник

E

EgorBo in pro.net
я вижу только _mm256_srli_epi32
источник

VK

Vitaliy ◀️TriΔng3l▶️ Kuzmin in pro.net
EgorBo
я вижу только _mm256_srli_epi32
ой :/
источник

E

EgorBo in pro.net
вот в этом и загвоздка :(
источник

E

EgorBo in pro.net
источник

E

EgorBo in pro.net
нашел для ссе и утф8/аскии
источник