Каково максимальное количество блоков в сетке, которые могут быть созданы для запуска ядра? Я немного запутался здесь, так как
Теперь таблица возможностей вычислений здесь говорит, что в CUDA-вычислении возможно наличие 65535 блоков на рассылку сетки.
Означает ли это общее количество блоков = 65535 * 65535?
Или это означает, что вы можете переставить максимум 65535 в 1d сетку из 65536 блоков или 2d сетки sqrt (65535) * sqrt (65535)?
Спасибо.