Я работаю над устройством GPU с очень высокой задержкой целочисленного деления, несколькими сотнями циклов. Я ищу оптимизацию разделов.
Все деления на знаменатель, который находится в наборе {1,3,6,10}, однако числитель - это положительное значение времени выполнения, примерно 32000 или меньше. из-за ограничений памяти, таблица поиска может не быть хорошим вариантом.
Можете ли вы подумать об альтернативах? Я думал о вычислении обратных точек с плавающей запятой и используя их для умножения числителя.
Спасибо
PS. спасибо людям. бит-сдвиг взлома - это действительно здорово. для восстановления после округления, я использую следующий сегмент C:
// q = m/n
q += (n*(j +1)-1) < m;