Можно ли использовать __syncthreads()
в блоке, где я целенаправленно удалял потоки с помощью return
?
В документации указано, что __syncthreads()
должен быть вызван каждым потоком в блоке, иначе он приведет к взаимоблокировке, но на практике я никогда не испытывал такого поведения.
Пример кода:
__global__ void kernel(float* data, size_t size) {
// Drop excess threads if user put too many in kernel call.
// After the return, there are `size` active threads.
if (threadIdx.x >= size) {
return;
}
// ... do some work ...
__syncthreads(); // Is this safe?
// For the rest of the kernel, we need to drop one excess thread
// After the return, there are `size - 1` active threads
if (threadIdx.x + 1 == size) {
return;
}
// ... do more work ...
__syncthreads(); // Is this safe?
}