Как я поднял в этот вопрос, gcc удаляет (да, с -O0
) строку кода _mm_div_ss(s1, s2);
предположительно, потому что результат не сохраняется, Однако это должно вызвать исключение с плавающей запятой и повысить SIGFPE, что не может произойти, если вызов удален.
Вопрос: Есть ли флаг или несколько флагов для передачи в gcc, чтобы код был скомпилирован как-есть? Я думаю что-то вроде fno-remove-unused
, но я не вижу ничего подобного. В идеале это был бы флаг компилятора вместо того, чтобы менять исходный код, но если это не поддерживается, есть ли какой-нибудь gcc-атрибут/прагма для использования?
Вещи, которые я пробовал:
$ gcc --help=optimizers | grep -i remove
нет результатов.
$ gcc --help=optimizers | grep -i unused
нет результатов.
И явно отключив все флаги мертвого кода/исключения - обратите внимание, что нет предупреждения о неиспользуемом коде:
$ gcc -O0 -msse2 -Wall -Wextra -pedantic -Winline \
-fno-dce -fno-dse -fno-tree-dce \
-fno-tree-dse -fno-tree-fre -fno-compare-elim -fno-gcse \
-fno-gcse-after-reload -fno-gcse-las -fno-rerun-cse-after-loop \
-fno-tree-builtin-call-dce -fno-tree-cselim a.c
a.c: In function ‘main’:
a.c:25:5: warning: ISO C90 forbids mixed declarations and code [-Wpedantic]
__m128 s1, s2;
^
$
Исходная программа
#include <stdio.h>
#include <signal.h>
#include <string.h>
#include <xmmintrin.h>
static void sigaction_sfpe(int signal, siginfo_t *si, void *arg)
{
printf("%d,%d,%d\n", signal, si!=NULL?1:0, arg!=NULL?1:0);
printf("inside SIGFPE handler\nexit now.\n");
exit(1);
}
int main()
{
struct sigaction sa;
memset(&sa, 0, sizeof(sa));
sigemptyset(&sa.sa_mask);
sa.sa_sigaction = sigaction_sfpe;
sa.sa_flags = SA_SIGINFO;
sigaction(SIGFPE, &sa, NULL);
_mm_setcsr(0x00001D80);
__m128 s1, s2;
s1 = _mm_set_ps(1.0, 1.0, 1.0, 1.0);
s2 = _mm_set_ps(0.0, 0.0, 0.0, 0.0);
_mm_div_ss(s1, s2);
printf("done (no error).\n");
return 0;
}
Компиляция вышеуказанной программы дает
$ ./a.out
done (no error).
Изменение строки
_mm_div_ss(s1, s2);
to
s2 = _mm_div_ss(s1, s2); // add "s2 = "
дает ожидаемый результат:
$ ./a.out
inside SIGFPE handler
Изменить с более подробной информацией.
Это похоже на атрибут __always_inline__
в определении _mm_div_ss
.
$ cat t.c
int
div(int b)
{
return 1/b;
}
int main()
{
div(0);
return 0;
}
$ gcc -O0 -Wall -Wextra -pedantic -Winline t.c -o t.out
$
(никаких предупреждений или ошибок)
$ ./t.out
Floating point exception
$
vs ниже (такое же, за исключением атрибутов функции)
$ cat t.c
__inline int __attribute__((__always_inline__))
div(int b)
{
return 1/b;
}
int main()
{
div(0);
return 0;
}
$ gcc -O0 -Wall -Wextra -pedantic -Winline t.c -o t.out
$
(никаких предупреждений или ошибок)
$ ./t.out
$
Добавление атрибута функции __warn_unused_result__
по крайней мере дает полезное сообщение:
$ gcc -O0 -Wall -Wextra -pedantic -Winline t.c -o t.out
t.c: In function ‘main’:
t.c:9:5: warning: ignoring return value of ‘div’, declared with attribute warn_unused_result [-Wunused-result]
div(0);
^
изменить:
Некоторые обсуждения gcc рассылки. В конечном счете, я думаю, что все работает по назначению.