Подтвердить что ты не робот

Является ли условный оператор медленным?

Я смотрел на некоторый код с огромным оператором switch и инструкцией if-else для каждого случая и мгновенно ощущал желание оптимизировать. Как хороший разработчик всегда должен делать, я собираюсь получить некоторые жесткие хронологические факты и начал с трех вариантов:

  • Оригинальный код выглядит следующим образом:

    public static bool SwitchIfElse(Key inKey, out char key, bool shift)
    {
        switch (inKey)
        {
           case Key.A: if (shift) { key = 'A'; } else { key = 'a'; } return true;
           case Key.B: if (shift) { key = 'B'; } else { key = 'b'; } return true;
           case Key.C: if (shift) { key = 'C'; } else { key = 'c'; } return true;
           ...
           case Key.Y: if (shift) { key = 'Y'; } else { key = 'y'; } return true;
           case Key.Z: if (shift) { key = 'Z'; } else { key = 'z'; } return true;
           ...
           //some more cases with special keys...
        }
        key = (char)0;
        return false;
    }
    
  • Второй вариант, преобразованный для использования условного оператора:

    public static bool SwitchConditionalOperator(Key inKey, out char key, bool shift)
    {
        switch (inKey)
        {
           case Key.A: key = shift ? 'A' : 'a'; return true;
           case Key.B: key = shift ? 'B' : 'b'; return true;
           case Key.C: key = shift ? 'C' : 'c'; return true;
           ...
           case Key.Y: key = shift ? 'Y' : 'y'; return true;
           case Key.Z: key = shift ? 'Z' : 'z'; return true;
           ...
           //some more cases with special keys...
        }
        key = (char)0;
        return false;
    }
    
  • Твист с использованием словаря, предварительно заполненного парами ключ/символ:

    public static bool DictionaryLookup(Key inKey, out char key, bool shift)
    {
        key = '\0';
        if (shift)
            return _upperKeys.TryGetValue(inKey, out key);
        else
            return _lowerKeys.TryGetValue(inKey, out key);
    }
    

Примечание: два оператора switch имеют одинаковые случаи, а словари имеют одинаковое количество символов.

Я ожидал, что 1) и 2) был несколько похож на производительность и что 3) будет немного медленнее.

Для каждого метода, выполняющего два раза 10.000.000 итераций для разминки, а затем по времени, к моему изумлению, я получаю следующие результаты:

  • 0.0000166 миллисекунд за звонок
  • 0.0000779 миллисекунд за звонок
  • 0.0000413 миллисекунд за звонок

Как это может быть? Условный оператор в четыре раза медленнее операторов if-else и почти в два раза медленнее, чем словарный поиск. Я пропустил что-то существенное здесь или условный оператор изначально медленно?

Обновление 1: Несколько слов о моей тестовой жгуте. Я запускаю следующий (псевдо) код для каждого из вышеперечисленных вариантов в Release скомпилированном проекте .Net 3.5 в Visual Studio 2010. Оптимизация кода включена, а константы DEBUG/TRACE отключены. Я запускаю метод, который измеряется один раз для разминки, прежде чем выполнять тайм-аут. Метод run выполнил метод для большого числа итераций, при этом shift установлен как true, так и false и с помощью набора кнопок ввода:

Run(method);
var stopwatch = Stopwatch.StartNew();
Run(method);
stopwatch.Stop();
var measure = stopwatch.ElapsedMilliseconds / iterations;

Метод Run выглядит так:

for (int i = 0; i < iterations / 4; i++)
{
    method(Key.Space, key, true);
    method(Key.A, key, true);
    method(Key.Space, key, false);
    method(Key.A, key, false);
}

Обновление 2: Копаем дальше, я посмотрел на ИЛ, сгенерированный для 1) и 2), и обнаружил, что структуры главного коммутатора идентичны, как и следовало ожидать, но тела корпуса имеют небольшие отличия, Вот IL, на которую я смотрю:

1) Если оператор else:

L_0167: ldarg.2 
L_0168: brfalse.s L_0170

L_016a: ldarg.1 
L_016b: ldc.i4.s 0x42
L_016d: stind.i2 
L_016e: br.s L_0174

L_0170: ldarg.1 
L_0171: ldc.i4.s 0x62
L_0173: stind.i2 

L_0174: ldc.i4.1 
L_0175: ret 

2) Условный оператор:

L_0165: ldarg.1 
L_0166: ldarg.2 
L_0167: brtrue.s L_016d

L_0169: ldc.i4.s 0x62
L_016b: br.s L_016f

L_016d: ldc.i4.s 0x42
L_016f: stind.i2 

L_0170: ldc.i4.1 
L_0171: ret 

Некоторые наблюдения:

  • Условный оператор веткится, когда shift равен true, а если /else веткится, когда shift является ложным.
  • В то время как 1) фактически компилируется еще несколько инструкций, чем 2), количество команд, выполняемых, когда shift является либо истинным, либо ложным, равны для двух.
  • Порядок инструкций для 1) таков, что только один слот стека занят все время, а 2) всегда загружает два.

У любого из этих наблюдений подразумевается, что условный оператор будет работать медленнее? Есть ли другие побочные эффекты, которые вступают в игру?

4b9b3361

Ответ 1

Очень странно, возможно, оптимизация .NET в вашем случае будет неприятной:

Автор разобрал несколько версии тернарных выражений и обнаружили, что они идентичны if-statements, с одним маленьким разница. Тройное утверждение иногда производит код, который проверяет противоположное условие, что вы ожидаем, так как в нем проверяется, что подвыражение является ложным вместо если это правда. Это переупорядочивает некоторые инструкции и могут иногда повышают производительность.

http://dotnetperls.com/ternary

Вы хотите, возможно, подумать о ToString о значении перечисления (для неспециальных случаев):

string keyValue = inKey.ToString();
return shift ? keyValue : keyValue.ToLower();

EDIT:
Я сравнивал метод if-else с тернарным оператором и с 1000000 циклами тернарный оператор всегда был не менее быстрым, чем метод if-else (иногда несколько миллисекунд быстрее, что поддерживает текст выше). Я думаю, что вы сделали ошибку в измерении времени, которое потребовалось.

Ответ 2

Мне было бы интересно узнать, тестируете ли вы это с помощью сборки Debug или Release. Если это отладочная сборка, то разница, скорее всего, будет разницей из-за LACK оптимизаций низкого уровня, которые компилятор добавляет, когда вы используете режим Release (или вручную отключите режим отладки и включите оптимизацию компилятора.)

Я бы ожидал с оптимизацией, однако, что тернарный оператор либо одинаковую скорость, либо бит быстрее, чем оператор if/else, в то время как поиск словаря является самым медленным. Вот мои результаты, 10 миллионов повторений разминки, за которыми следуют 10 миллионов таймеров, для каждого:

РЕЖИМ DEBUG

   If/Else: 00:00:00.7211259
   Ternary: 00:00:00.7923924
Dictionary: 00:00:02.3319567

РЕЖИМ РЕЖИМА

   If/Else: 00:00:00.5217478
   Ternary: 00:00:00.5050474
Dictionary: 00:00:02.7389423

Я думаю, что здесь интересно отметить, что до того, как были включены оптимизации, тройное вычисление было медленнее, чем if/else, а после - быстрее.

EDIT:

После немного более тщательного тестирования, в практическом смысле, между if/else и trernary нет никакой разницы. В то время как тройной код приводит к меньшему ИЛ, они выполняют почти то же самое, что и друг друга. В десятке различных тестов с двоичным кодом режима выпуска результаты if/else и trernary были либо идентичными, либо отключены на долю миллисекунды для 10 000 000 итераций. Иногда, если /else был немного быстрее, иногда тройной был, но по всей практичности они выполняли то же самое.

Словарь выполняет значительно хуже, с другой стороны. Когда дело доходит до таких оптимизаций, я бы не тратил время на выбор между if/else и trernary, если код уже существует. Однако, если у вас в настоящее время есть реализация словаря, я бы определенно реорганизовал его для использования более эффективного подхода и улучшил вашу производительность примерно на 400% (для данной функции, во всяком случае.)

Ответ 3

Интересно, я ушел и разработал небольшой класс IfElseTernaryTest здесь, ок, код на самом деле не оптимизирован или хороший пример, но тем не менее... ради обсуждения:

public class IfElseTernaryTest
{
    private bool bigX;
    public void RunIfElse()
    {
        int x = 4; int y = 5;
        if (x &gt; y) bigX = false;
        else if (x &lt; y) bigX = true; 
    }
    public void RunTernary()
    {
        int x = 4; int y = 5;
        bigX = (x &gt; y) ? false : ((x &lt; y) ? true : false);
    }
}

Это был дамп кода кода... интересная часть заключалась в том, что тройные инструкции в IL были на самом деле короче if....

.class /*02000003*/ public auto ansi beforefieldinit ConTern.IfElseTernaryTest
       extends [mscorlib/*23000001*/]System.Object/*01000001*/
{
  .field /*04000001*/ private bool bigX
  .method /*06000003*/ public hidebysig instance void 
          RunIfElse() cil managed
  // SIG: 20 00 01
  {
    // Method begins at RVA 0x205c
    // Code size       44 (0x2c)
    .maxstack  2
    .locals /*11000001*/ init ([0] int32 x,
             [1] int32 y,
             [2] bool CS$4$0000)
    .line 19,19 : 9,10 ''
//000013:     }
//000014: 
//000015:     public class IfElseTernaryTest
//000016:     {
//000017:         private bool bigX;
//000018:         public void RunIfElse()
//000019:         {
    IL_0000:  /* 00   |                  */ nop
    .line 20,20 : 13,23 ''
//000020:             int x = 4; int y = 5;
    IL_0001:  /* 1A   |                  */ ldc.i4.4
    IL_0002:  /* 0A   |                  */ stloc.0
    .line 20,20 : 24,34 ''
    IL_0003:  /* 1B   |                  */ ldc.i4.5
    IL_0004:  /* 0B   |                  */ stloc.1
    .line 21,21 : 13,23 ''
//000021:             if (x &gt; y) bigX = false;
    IL_0005:  /* 06   |                  */ ldloc.0
    IL_0006:  /* 07   |                  */ ldloc.1
    IL_0007:  /* FE02 |                  */ cgt
    IL_0009:  /* 16   |                  */ ldc.i4.0
    IL_000a:  /* FE01 |                  */ ceq
    IL_000c:  /* 0C   |                  */ stloc.2
    IL_000d:  /* 08   |                  */ ldloc.2
    IL_000e:  /* 2D   | 09               */ brtrue.s   IL_0019

    .line 21,21 : 24,37 ''
    IL_0010:  /* 02   |                  */ ldarg.0
    IL_0011:  /* 16   |                  */ ldc.i4.0
    IL_0012:  /* 7D   | (04)000001       */ stfld      bool ConTern.IfElseTernaryTest/*02000003*/::bigX /* 04000001 */
    IL_0017:  /* 2B   | 12               */ br.s       IL_002b

    .line 22,22 : 18,28 ''
//000022:             else if (x &lt; y) bigX = true; 
    IL_0019:  /* 06   |                  */ ldloc.0
    IL_001a:  /* 07   |                  */ ldloc.1
    IL_001b:  /* FE04 |                  */ clt
    IL_001d:  /* 16   |                  */ ldc.i4.0
    IL_001e:  /* FE01 |                  */ ceq
    IL_0020:  /* 0C   |                  */ stloc.2
    IL_0021:  /* 08   |                  */ ldloc.2
    IL_0022:  /* 2D   | 07               */ brtrue.s   IL_002b

    .line 22,22 : 29,41 ''
    IL_0024:  /* 02   |                  */ ldarg.0
    IL_0025:  /* 17   |                  */ ldc.i4.1
    IL_0026:  /* 7D   | (04)000001       */ stfld      bool ConTern.IfElseTernaryTest/*02000003*/::bigX /* 04000001 */
    .line 23,23 : 9,10 ''
//000023:         }
    IL_002b:  /* 2A   |                  */ ret
  } // end of method IfElseTernaryTest::RunIfElse

  .method /*06000004*/ public hidebysig instance void 
          RunTernary() cil managed
  // SIG: 20 00 01
  {
    // Method begins at RVA 0x2094
    // Code size       27 (0x1b)
    .maxstack  3
    .locals /*11000002*/ init ([0] int32 x,
             [1] int32 y)
    .line 25,25 : 9,10 ''
//000024:         public void RunTernary()
//000025:         {
    IL_0000:  /* 00   |                  */ nop
    .line 26,26 : 13,23 ''
//000026:             int x = 4; int y = 5;
    IL_0001:  /* 1A   |                  */ ldc.i4.4
    IL_0002:  /* 0A   |                  */ stloc.0
    .line 26,26 : 24,34 ''
    IL_0003:  /* 1B   |                  */ ldc.i4.5
    IL_0004:  /* 0B   |                  */ stloc.1
    .line 27,27 : 13,63 ''
//000027:             bigX = (x &gt; y) ? false : ((x &lt; y) ? true : false);
    IL_0005:  /* 02   |                  */ ldarg.0
    IL_0006:  /* 06   |                  */ ldloc.0
    IL_0007:  /* 07   |                  */ ldloc.1
    IL_0008:  /* 30   | 0A               */ bgt.s      IL_0014

    IL_000a:  /* 06   |                  */ ldloc.0
    IL_000b:  /* 07   |                  */ ldloc.1
    IL_000c:  /* 32   | 03               */ blt.s      IL_0011

    IL_000e:  /* 16   |                  */ ldc.i4.0
    IL_000f:  /* 2B   | 01               */ br.s       IL_0012

    IL_0011:  /* 17   |                  */ ldc.i4.1
    IL_0012:  /* 2B   | 01               */ br.s       IL_0015

    IL_0014:  /* 16   |                  */ ldc.i4.0
    IL_0015:  /* 7D   | (04)000001       */ stfld      bool ConTern.IfElseTernaryTest/*02000003*/::bigX /* 04000001 */
    .line 28,28 : 9,10 ''
//000028:         }
    IL_001a:  /* 2A   |                  */ ret
  } // end of method IfElseTernaryTest::RunTernary

Итак, кажется, что тройной оператор, по-видимому, короче, и я бы предположил, что быстрее, чем используется меньшее количество инструкций... но на этом основании, похоже, это противоречит вашему делу №2, что удивительно...

Изменить: После комментария Sky, предлагая "надуть код для № 2", это опровергнет то, что сказал Скай! Ок, код отличается, контекст другой, это пример упражнений, чтобы проверить дамп IL, чтобы увидеть...

Ответ 4

Я бы ожидал, что # 1 и # 2 будут одинаковыми. Оптимизатор должен привести к тому же коду. Словарь в # 3 ожидается медленным, если он не оптимизирован каким-то образом, чтобы не использовать хэш.

При кодировании систем реального времени мы всегда использовали справочную таблицу - простой массив - для перевода, как указано в вашем примере. Это самый быстрый, когда диапазон ввода довольно мал.

Ответ 5

Я не совсем понимаю, почему вы ожидаете, что оператор if будет медленнее, чем поиск в словаре. По крайней мере, нужно вычислить хэш-код, а затем его нужно найти в списке. Я не понимаю, почему вы предполагаете, что это быстрее, чем cmp/jmp.

В частности, я даже не думаю, что метод, который вы оптимизируете, очень велик; кажется, что на этапе вызова он может стать лучше (хотя я не могу быть уверен, поскольку вы не предоставили контекст).

Ответ 6

Предполагая, что вас беспокоит производительность этого метода (а если нет, зачем его отправлять?), вы должны рассмотреть возможность хранения значений char в массиве и преобразования значений Key в индекс в массив.

Ответ 7

У меня нет VS на руку, но, конечно, есть простой встроенный способ получить ключ как персонажа? Что-то вроде метода toString, чтобы вы могли заменить это чудовищное switch на это:

if (shift)
  return inKey.toString().toUppercase();
else
  return inKey.toString().toLowercase();

Ответ 8

Я бы выбрал третий вариант только потому, что он более читабельный/поддерживаемый. Я уверен, что этот код не является узким местом производительности вашего приложения.