Который дает количество тактовых циклов между двумя вызовами. Будьте осторожны, таймер будет переполняться через пару секунд, поэтому вы должны быть уверены, что продолжительность кода между последовательными вызовами довольно короткая. Вы также должны знать, что компилятор и ассемблер выполняют переупорядочение команд, поэтому вам может потребоваться проверить, что вызовы часов не замыкаются друг на друга на выходе SASS (используйте cudaobjdump для проверки).