Подтвердить что ты не робот

Почему GCC вызывает libc sqrt() без использования его результата?

Используя GCC 6.3, следующий код С++:

#include <cmath>
#include <iostream>

void norm(double r, double i)
{
    double n = std::sqrt(r * r + i * i);
    std::cout << "norm = " << n;
}

генерирует следующую сборку x86-64:

norm(double, double):
        mulsd   %xmm1, %xmm1
        subq    $24, %rsp
        mulsd   %xmm0, %xmm0
        addsd   %xmm1, %xmm0
        pxor    %xmm1, %xmm1
        ucomisd %xmm0, %xmm1
        sqrtsd  %xmm0, %xmm2
        movsd   %xmm2, 8(%rsp)
        jbe     .L2
        call    sqrt
.L2:
        movl    std::cout, %edi
        movl    $7, %edx
        movl    $.LC1, %esi
        call    std::basic_ostream<char, std::char_traits<char> >& std::__ostream_insert<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*, long)
        movsd   8(%rsp), %xmm0
        movl    std::cout, %edi
        addq    $24, %rsp
        jmp     std::basic_ostream<char, std::char_traits<char> >& std::basic_ostream<char, std::char_traits<char> >::_M_insert<double>(double)

Для вызова std::sqrt GCC сначала использует его sqrtsd и сохраняет результат в стек. Если он переполняется, он вызывает функцию libc sqrt. Но он никогда не сохраняет xmm0 после этого и до второго вызова operator<<, он восстанавливает значение из стека (поскольку xmm0 был потерян при первом вызове operator<<).

С более простым std::cout << n; это еще более очевидно:

subq    $24, %rsp
movsd   %xmm1, 8(%rsp)
call    sqrt
movsd   8(%rsp), %xmm1
movl    std::cout, %edi
addq    $24, %rsp
movapd  %xmm1, %xmm0
jmp     std::basic_ostream<char, std::char_traits<char> >& std::basic_ostream<char, std::char_traits<char> >::_M_insert<double>(double)

Почему GCC не использует значение xmm0, вычисленное libc sqrt?

4b9b3361

Ответ 1

Не нужно вызывать sqrt для вычисления результата; он уже был рассчитан инструкцией SQRTSD. Он вызывает sqrt для генерирования требуемого поведения в соответствии со стандартом, когда отрицательное число передается на sqrt (например, установите errno и/или создайте исключение с плавающей запятой). Инструкции PXOR, UCOMISD и JBE проверяют, является ли аргумент меньше 0 и пропускают вызов sqrt, если это неверно.