Телеграмм чат группы ChatAssembler страница 2912

Не, ну если из-под DOSBox с cycles=10, тогда вопросов нет.

мож у тя что получится идеи подкинуть

https://t.me/ChatAssembler/58214

12:08пожаловаться #1

ST

BS 135

то что никто не хочет изобретать велосипеды - это большая проблема, одна из главных причин глюков и багов

Да можно конечно и с нуля написать, но для этого надо понимать что писать и для чего, разбираться в принципах, в законах построения (я ни в одном глазу что там и как, откуда мне знать?)
А когда за тебя уже кто-то разобрался и написал нечто близкое к идеалу, то всё что осталось тебе, так это лишь понять что и как работает, а там уж можно и по-своему переписать хоть с нуля и может быть даже проще получится.

12:12пожаловаться #2

B1

BS 135 in Ассемблер

Да можно конечно и с нуля написать, но для этого надо понимать что писать и для чего, разбираться в принципах, в законах построения (я ни в одном глазу что там и как, откуда мне знать?)
А когда за тебя уже кто-то разобрался и написал нечто близкое к идеалу, то всё что осталось тебе, так это лишь понять что и как работает, а там уж можно и по-своему переписать хоть с нуля и может быть даже проще получится.

вот поэтому уже написанное говно никто и не чистит...🥺🥺

12:13пожаловаться #3

B1

BS 135 in Ассемблер

😭😭

12:13пожаловаться #4

EK

мож у тя что получится идеи подкинуть

https://t.me/ChatAssembler/58214

Да тут надо поллитра, а то и литр!

12:19пожаловаться #5

B1

BS 135 in Ассемблер

у нас тут оффтоп!

12:20пожаловаться #6

B1

BS 135 in Ассемблер

баним нарушителя

12:20пожаловаться #7

EK

мож у тя что получится идеи подкинуть

https://t.me/ChatAssembler/58214

Давай зайдём с другой стороны.
Неужели другого алгоритма нет? Попроще.

12:23пожаловаться #8

EK

BS 135

у нас тут оффтоп!

Где? 🪓

12:23пожаловаться #9

B1

BS 135 in Ассемблер

Где? 🪓

я боюся

12:23пожаловаться #10

ST

https://t.me/ChatAssembler/61060

Давай зайдём с другой стороны.
Неужели другого алгоритма нет? Попроще.

Saenro in Ассемблер

12:24пожаловаться #11

EK

https://t.me/ChatAssembler/61060

Saenro in Ассемблер

Ты предлагаешь разреверсить его? 😁

Aiwan ╭∩╮ (òÓ,) ╭∩╮b... in Ассемблер

12:25пожаловаться #12

A

Давай зайдём с другой стороны.
Неужели другого алгоритма нет? Попроще.

есть, но результат мне их не нравится

12:29пожаловаться #13

ST

Ты предлагаешь разреверсить его? 😁

Более того, FPU там встречается крайне редко.

12:31пожаловаться #14

EK

Вот, кстати, вопрос.
Может, можно это всё как-то без FPU сделать? :D
Ну да, это жёстко.

12:38пожаловаться #15

楽

楽園松本 in Ассемблер

Да можно конечно и с нуля написать, но для этого надо понимать что писать и для чего, разбираться в принципах, в законах построения (я ни в одном глазу что там и как, откуда мне знать?)
А когда за тебя уже кто-то разобрался и написал нечто близкое к идеалу, то всё что осталось тебе, так это лишь понять что и как работает, а там уж можно и по-своему переписать хоть с нуля и может быть даже проще получится.

А я на своём опыте убедился, что лучше делать самому с нуля. Времени потратится столько же, сколько разбираться с чужим.

Aiwan ╭∩╮ (òÓ,) ╭∩╮b... in Ассемблер

12:39пожаловаться #16

A

https://t.me/ChatAssembler/61060

Saenro in Ассемблер

не нашел там 16 цветный дизеринг? кто нашел скиньте скрин покрупней участок какой нить

12:39пожаловаться #17

ST

не нашел там 16 цветный дизеринг? кто нашел скиньте скрин покрупней участок какой нить

Клавиши "-" и "+". Потыкай минусом пока не появится в 16 colour ordered dithering

12:42пожаловаться #18

ST

Есть 16 colour random dithering, почти выковырял его, но как оказалось он не нужен.

12:51пожаловаться #19

EK

мож у тя что получится идеи подкинуть

https://t.me/ChatAssembler/58214

Я глянул мельком.
Что вижу?

1. Штуки вроде

        fld1
        fxch
        fsubp

можно заменить на

        fld1
        fsubrp

Т.е. убрать лишние шаги.
Посмотреть где ещё что-то подобное делается.

2. Оптимизировать:

macro deg2rad {
        fmul  qword[pi_180]
}
  pi_180        dq 0.01745329251994 ; Pi/180

Мы избавляемся от деления и лишних этапов (3 инструкции превратились в 1).
Соответственно, удаляем все деления, какие только можем, заменяя их умножением на обратную величину.
Видел у тебя там fdiv qword[_0.5], когда можно fmul qword[_2.0] сделать. И не только _0.5, а много таких мест.

3. Далее, переведи сопроцессор в режим работы с числами одинарной точности. Не могу гарантировать, но что-то мне подсказывает, что так будет работать быстрее. Нужно через fldcw загрузить нужный режим. Плюс, замени все числа qword на dword. Зачем тебе такая точность?

4. Вот такие штуки замечены:

        fld     qword[bx+LABITEM.L]
        fadd    qword[bx+LABITEM.L]

Можно же написать без лишнего обращения к памяти:

        fld     qword[bx+LABITEM.L]
        fadd    st0,st0

5. Если не принципиальна поддержка 386 (или что там у тебя), используй fcomi* вместо fcom*, а лучше — вообще SSE.
Если важен 386, то замени sahf + .if CARRY? на test ah,1.

6. Где можно обойтись целочисленной арифметикой, веди расчёт в целых числах (без f-инструкций).

7. Но это всё, мне кажется, даст прирост несущественный :)
Может, 10%, а может 5%, а может 0.5%.

А существенный прирост даст переработка алгоритма.
Что-то мне подсказывает, что 90% (95%) кода можно вообще в топку отправить.
Во-первых, найдя другой метод.
Во-вторых, оптимизировав алгоритм (сначала на бумажке, сократив какие-то множители или т.п.).
В-третьих, вероятно можно циклы сократить как-то. Ну или уменьшить их хотя бы, сделать где-то через один и пр.
В-четвёртых, убрать лишние преобразования туда-сюда (может, можно и без LAB обойтись, а как-то в RGB сделать? Не cпеши говорить "нет", подумай).