У меня есть GeForce GTX 580, и я хочу сделать выражение об общем количестве потоков, которые могут (в идеале) выполняться параллельно, для сравнения с 2 или 4 многоядерными процессорами.
deviceQuery дает мне следующую возможную информацию:
CUDA Capability Major/Minor version number: 2.0
(16) Multiprocessors x (32) CUDA Cores/MP: 512 CUDA
Maximum number of threads per block: 1024
Я думаю, я слышал, что каждое ядро CUDA может работать параллельно, и что warp - 32 потока. Правильно ли было бы сказать, что карта может запускать 512 * 32 = 16384 потоков параллельно, или я ухожу, а ядра CUDA как-то не работают параллельно?