В CUDA существует концепция warp, которая определяется как максимальное количество потоков, которые могут выполнять одну и ту же команду одновременно в пределах одного обрабатывающего элемента. Для NVIDIA этот размер основы составляет 32 для всех своих карт, которые в настоящее время находятся на рынке.
В карточках ATI существует аналогичная концепция, но терминология в этом контексте - волновой фронт. После некоторой охоты, я узнал, что карта ATI у меня имеет размер волнового фронта 64.
Мой вопрос: что я могу сделать для запроса этой ширины SIMD во время выполнения для OpenCL?