int SWAR(unsigned int i)
{
i = i - ((i >> 1) & 0x55555555);
i = (i & 0x33333333) + ((i >> 2) & 0x33333333);
return (((i + (i >> 4)) & 0x0F0F0F0F) * 0x01010101) >> 24;
}
Я видел этот код, который считает число бит равным 1
в 32-битном целочисленном, и я заметил, что его производительность лучше, чем __builtin_popcount
, но я не могу понять, как это работает.
Может кто-нибудь дать подробное объяснение того, как работает этот код?