Поиск по форумам NVIDIA я нашел эти вопросы, которые также представляют для меня интерес, но никто не ответил им за последние четыре дня или так. Вы можете помочь?
Оригинальная публикация форума
Копаясь в учебниках по чтению OpenCL, некоторые вещи остались неясными для меня. Вот набор моих вопросов относительно локальных и глобальных рабочих размеров.
Должен ли
global_work_size
быть меньше, чемCL_DEVICE_MAX_WORK_ITEM_SIZES
? На моей машинеCL_DEVICE_MAX_WORK_ITEM_SIZES
= 512, 512, 64.Является ли
CL_KERNEL_WORK_GROUP_SIZE
рекомендуемымwork_group_size
для используемого ядра?
- Или это единственный
work_group_size
, который позволяет использовать GPU? На моей машинеCL_KERNEL_WORK_GROUP_SIZE
= 512Нужно ли делиться с рабочими группами или иметь только один, но не указывая
local_work_size
?
- К чему я должен обратить внимание, когда у меня есть только одна рабочая группа?
Что означает
CL_DEVICE_MAX_WORK_GROUP_SIZE
? На моей машинеCL_DEVICE_MAX_WORK_GROUP_SIZE
= 512, 512, 64
- Означает ли это, что у меня может быть одна рабочая группа размером до
CL_DEVICE_MAX_WORK_ITEM_SIZES
?Имеет ли
global_work_size
делительCL_DEVICE_MAX_WORK_ITEM_SIZES
? В моем кодеglobal_work_size
= 20.