Ближайшее целое число с плавающей точкой в С++ 03

Для некоторого целочисленного типа, как я могу найти значение, которое ближе всего к некоторому значению типа с плавающей точкой, даже если значение с плавающей запятой находится далеко за пределами отображаемого диапазона целого числа.

Или точнее:

Пусть F - тип с плавающей запятой (возможно, float, double или long double). Пусть I - целочисленный тип.

Предположим, что оба F и I имеют действительные специализации std::numeric_limits<>.

Учитывая представимое значение F и используя только С++ 03, как я могу найти ближайшее представляемое значение I?

Я получаю в чистом, эффективном и потокобезопасном решении, и тот, который не принимает ничего о платформе, кроме того, что гарантируется С++ 03.

Если такого решения не существует, можно ли найти его, используя новые функции C99/С++ 11?

Использование lround() для C99 кажется проблематичным из-за нетривиального способа регистрации ошибок домена. Могут ли эти ошибки домена быть обнаружены в переносном и потокобезопасном режиме?

Примечание. Я знаю, что Boost, вероятно, предлагает решение через его шаблон boost::numerics::converter<>, но из-за его высокой сложности и многословия, и я не смог извлечь из него необходимые вещи, и поэтому я не смог чтобы проверить, делает ли их решение допущения за пределами С++ 03.

Следующий наивный подход терпит неудачу из-за того, что результат I(f) равен undefined С++ 03, когда неотъемлемая часть F не является представимым значением I.

template<class I, class F> I closest_int(F f)
{
  return I(f);
}

Рассмотрим следующий подход:

template<class I, class F> I closest_int(F f)
{
  if (f < std::numeric_limits<I>::min()) return std::numeric_limits<I>::min();
  if (std::numeric_limits<I>::max() < f) return std::numeric_limits<I>::max();
  return I(f);
}

Это также терпит неудачу, поскольку интегральные части F(std::numeric_limits::min()) и F(std::numeric_limits::max()) все еще не могут быть представлены в I.

Наконец, рассмотрим этот третий подход, который также терпит неудачу:

template<class I, class F> I closest_int(F f)
{
  if (f <= std::numeric_limits<I>::min()) return std::numeric_limits<I>::min();
  if (std::numeric_limits<I>::max() <= f) return std::numeric_limits<I>::max();
  return I(f);
}

На этот раз I(f) всегда будет иметь четко определенный результат, так как F(std::numeric_limits::max()) может быть намного меньше, чем std::numeric_limits::max(), возможно, мы вернем std::numeric_limits::max() для значения с плавающей запятой, которое несколько целых значений ниже std::numeric_limits::max().

Обратите внимание, что вся проблема возникает из-за того, что она undefined округляется ли конверсия F(i) или до ближайшего представляемого значения с плавающей запятой.

Вот соответствующий раздел из С++ 03 (4.9 Плавающие интегральные преобразования):

Значение целочисленного типа или типа перечисления может быть преобразовано в значение r с плавающей запятой тип. Результат является точным, если это возможно. В противном случае это будет определенный реализацией выбор либо следующего более низкое или более высокое представляемое значение.

// file: f2i.cpp // // compiled with MinGW x86 (gcc version 4.6.2) as: // g++ -Wall -O2 -std=c++03 f2i.cpp -o f2i.exe #include <iostream> #include <iomanip> #include <limits> using namespace std; template<class I, class F> I truncAndCap(F f) { /* This function converts (by truncating the fractional part) the floating-point value f (of type F) into an integer value (of type I), avoiding undefined behavior by returning std::numeric_limits::min() and std::numeric_limits::max() when f is too small or too big to be converted to type I directly. 2 problems: - F may fail to convert to I, which is undefined behavior and we want to avoid that. - I may not convert exactly into F - Direct I & F comparison fails because of I to F promotion, which can be inexact. This solution is for the most practical case when I and F are radix-2 (binary) integer and floating-point types. */ int Idigits = numeric_limits::digits; int Isigned = numeric_limits::is_signed; /* Calculate cutOffMax = 2 ^ std::numeric_limits::digits (where ^ denotes exponentiation) as a value of type F. We assume that F is a radix-2 (binary) floating-point type AND it has a big enough exponent part to hold the value of std::numeric_limits::digits. FLT_MAX_10_EXP/DBL_MAX_10_EXP/LDBL_MAX_10_EXP >= 37 (guaranteed per C++ standard from 2003/C standard from 1999) corresponds to log2(1e37) ~= 122, so the type I can contain up to 122 bits. In practice, integers longer than 64 bits are extremely rare (if existent at all), especially on old systems of the 2003 C++ standard time. */ const F cutOffMax = F(I(1) << Idigits / 2) * F(I(1) << (Idigits / 2 + Idigits % 2)); if (f >= cutOffMax) return numeric_limits::max(); /* Calculate cutOffMin = - 2 ^ std::numeric_limits::digits (where ^ denotes exponentiation) as a value of type F for signed I OR cutOffMin = 0 for unsigned I in a similar fashion. */ const F cutOffMin = Isigned ? -F(I(1) << Idigits / 2) * F(I(1) << (Idigits / 2 + Idigits % 2)) : 0; if (f <= cutOffMin) return numeric_limits::min(); /* Mathematically, we may still have a little problem (2 cases): cutOffMin < f < std::numeric_limits::min() srd::numeric_limits::max() < f < cutOffMax These cases are only possible when f isn't a whole number, when it either std::numeric_limits::min() - value in the range (0,1) or std::numeric_limits::max() + value in the range (0,1). We can ignore this altogether because converting f to type I is guaranteed to truncate the fractional part off, and therefore I(f) will always be in the range [std::numeric_limits::min(), std::numeric_limits::max()]. */ return I(f); } template<class I, class F> void test(const char* msg, F f) { I i = truncAndCap<I,F>(f); cout << msg << setiosflags(ios_base::showpos) << setw(14) << setprecision(12) << f << " -> " <(#F " -> " #I ": ", VAL); int main() { TEST(short, float, -1.75f); TEST(short, float, -1.25f); TEST(short, float, +0.00f); TEST(short, float, +1.25f); TEST(short, float, +1.75f); TEST(short, float, -32769.00f); TEST(short, float, -32768.50f); TEST(short, float, -32768.00f); TEST(short, float, -32767.75f); TEST(short, float, -32767.25f); TEST(short, float, -32767.00f); TEST(short, float, -32766.00f); TEST(short, float, +32766.00f); TEST(short, float, +32767.00f); TEST(short, float, +32767.25f); TEST(short, float, +32767.75f); TEST(short, float, +32768.00f); TEST(short, float, +32768.50f); TEST(short, float, +32769.00f); TEST(int, float, -2147483904.00f); TEST(int, float, -2147483648.00f); TEST(int, float, -16777218.00f); TEST(int, float, -16777216.00f); TEST(int, float, -16777215.00f); TEST(int, float, +16777215.00f); TEST(int, float, +16777216.00f); TEST(int, float, +16777218.00f); TEST(int, float, +2147483648.00f); TEST(int, float, +2147483904.00f); TEST(int, double, -2147483649.00); TEST(int, double, -2147483648.00); TEST(int, double, -2147483647.75); TEST(int, double, -2147483647.25); TEST(int, double, -2147483647.00); TEST(int, double, +2147483647.00); TEST(int, double, +2147483647.25); TEST(int, double, +2147483647.75); TEST(int, double, +2147483648.00); TEST(int, double, +2147483649.00); TEST(unsigned, double, -1.00); TEST(unsigned, double, +1.00); TEST(unsigned, double, +4294967295.00); TEST(unsigned, double, +4294967295.25); TEST(unsigned, double, +4294967295.75); TEST(unsigned, double, +4294967296.00); TEST(unsigned, double, +4294967297.00); return 0; }

float -> short: -1.75 -> -1 float -> short: -1.25 -> -1 float -> short: +0 -> +0 float -> short: +1.25 -> +1 float -> short: +1.75 -> +1 float -> short: -32769 -> -32768 float -> short: -32768.5 -> -32768 float -> short: -32768 -> -32768 float -> short: -32767.75 -> -32767 float -> short: -32767.25 -> -32767 float -> short: -32767 -> -32767 float -> short: -32766 -> -32766 float -> short: +32766 -> +32766 float -> short: +32767 -> +32767 float -> short: +32767.25 -> +32767 float -> short: +32767.75 -> +32767 float -> short: +32768 -> +32767 float -> short: +32768.5 -> +32767 float -> short: +32769 -> +32767 float -> int: -2147483904 -> -2147483648 float -> int: -2147483648 -> -2147483648 float -> int: -16777218 -> -16777218 float -> int: -16777216 -> -16777216 float -> int: -16777215 -> -16777215 float -> int: +16777215 -> +16777215 float -> int: +16777216 -> +16777216 float -> int: +16777218 -> +16777218 float -> int: +2147483648 -> +2147483647 float -> int: +2147483904 -> +2147483647 double -> int: -2147483649 -> -2147483648 double -> int: -2147483648 -> -2147483648 double -> int: -2147483647.75 -> -2147483647 double -> int: -2147483647.25 -> -2147483647 double -> int: -2147483647 -> -2147483647 double -> int: +2147483647 -> +2147483647 double -> int: +2147483647.25 -> +2147483647 double -> int: +2147483647.75 -> +2147483647 double -> int: +2147483648 -> +2147483647 double -> int: +2147483649 -> +2147483647 double -> unsigned: -1 -> 0 double -> unsigned: +1 -> 1 double -> unsigned: +4294967295 -> 4294967295 double -> unsigned: +4294967295.25 -> 4294967295 double -> unsigned: +4294967295.75 -> 4294967295 double -> unsigned: +4294967296 -> 4294967295 double -> unsigned: +4294967297 -> 4294967295

Ответ 1