... или просто потоки в текущей деформации или блоке?
Кроме того, когда потоки в конкретном блоке встречаются (в ядре), следующая строка
__shared__ float srdMem[128];
будут ли они просто объявлять это пространство один раз (за каждый блок)?
Все они, очевидно, работают асинхронно, поэтому, если Thread 23 в блоке 22 является первым потоком для достижения этой строки, а затем Thread 69 в блоке 22 является последним для достижения этой строки, Thread 69 будет знать, что он уже был объявлен