Подтвердить что ты не робот

Является ли выполнение функций частичного или карри, хорошо определенных в Haskell?

В следующем коде:

ismaxl :: (Ord a) => [a] -> a -> Bool
ismaxl l x = x == maxel
           where maxel = maximum l

main = do
  let mylist = [1, 2, 3, 5]
  let ismax = ismaxl mylist
  --Is each call O(1)?  Does each call remember maxel?
  let c1 = ismax 1
  let c2 = ismax 2
  let c3 = ismax 3
  let c5 = ismax 5
  putStrLn (show [c1, c2, c3, c5])

Частичная функция ismax, вычисляет maxel? Говоря конкретно, может ли кто-нибудь указать на правило о сложности частичных функций в Haskell? ДОЛЖЕН, чтобы компилятор вызывал максимум один раз в приведенном выше примере? Иными словами, выполняет ли частичная функция ссылки на предыдущие вызовы для внутренних, где предложения?

У меня есть некоторый код, связанный с ЦП, который не выполняется приемлемо, и я ищу возможные ошибки в рассуждениях о сложности.

4b9b3361

Ответ 1

Как демонстрация того, что вы можете узнать из профилирования вашего кода Haskell, вот результат некоторых незначительных изменений в вашем коде. Во-первых, я заменил mylist на [0..10000000], чтобы убедиться, что для вычисления максимального значения требуется некоторое время.

Здесь некоторые строки из профилирующего вывода после запуска этой версии:

COST CENTRE                    MODULE               %time %alloc

ismaxl                         Main                  55.8    0.0
main                           Main                  44.2  100.0

                                                         individual    inherited
COST CENTRE              MODULE         no.    entries  %time %alloc   %time %alloc

MAIN                     MAIN            1           0   0.0    0.0   100.0  100.0
 CAF:main_c5             Main          225           1   0.0    0.0    15.6    0.0
  main                   Main          249           0   0.0    0.0    15.6    0.0
   ismaxl                Main          250           1  15.6    0.0    15.6    0.0
 CAF:main_c3             Main          224           1   0.0    0.0    15.6    0.0
  main                   Main          246           0   0.0    0.0    15.6    0.0
   ismaxl                Main          247           1  15.6    0.0    15.6    0.0
 CAF:main_c2             Main          223           1   0.0    0.0    14.3    0.0
  main                   Main          243           0   0.0    0.0    14.3    0.0
   ismaxl                Main          244           1  14.3    0.0    14.3    0.0
 CAF:main_c1             Main          222           1   0.0    0.0    10.4    0.0
  main                   Main          239           0   0.0    0.0    10.4    0.0
   ismaxl                Main          240           1  10.4    0.0    10.4    0.0
 CAF:main8               Main          221           1   0.0    0.0    44.2  100.0
  main                   Main          241           0  44.2  100.0    44.2  100.0

Это довольно очевидно, перечитав максимум здесь.

Теперь, заменив ismaxl на это:

ismaxl :: (Ord a) => [a] -> a -> Bool
ismaxl l = let maxel = maximum l in (== maxel)

... и профилирование снова:

COST CENTRE                    MODULE               %time %alloc

main                           Main                  60.5  100.0
ismaxl                         Main                  39.5    0.0

                                                         individual    inherited
COST CENTRE              MODULE         no.    entries  %time %alloc   %time %alloc

MAIN                     MAIN            1           0   0.0    0.0   100.0  100.0
 CAF:main_c5             Main          227           1   0.0    0.0     0.0    0.0
  main                   Main          252           0   0.0    0.0     0.0    0.0
   ismaxl                Main          253           1   0.0    0.0     0.0    0.0
 CAF:main_c3             Main          226           1   0.0    0.0     0.0    0.0
  main                   Main          249           0   0.0    0.0     0.0    0.0
   ismaxl                Main          250           1   0.0    0.0     0.0    0.0
 CAF:main_c2             Main          225           1   0.0    0.0     0.0    0.0
  main                   Main          246           0   0.0    0.0     0.0    0.0
   ismaxl                Main          247           1   0.0    0.0     0.0    0.0
 CAF:main_c1             Main          224           1   0.0    0.0     0.0    0.0
 CAF:main_ismax          Main          223           1   0.0    0.0    39.5    0.0
  main                   Main          242           0   0.0    0.0    39.5    0.0
   ismaxl                Main          243           2  39.5    0.0    39.5    0.0
 CAF:main8               Main          222           1   0.0    0.0    60.5  100.0
  main                   Main          244           0  60.5  100.0    60.5  100.0

... на этот раз он проводит большую часть своего времени в одном вызове ismaxl, другие слишком быстро, чтобы даже заметить, поэтому он должен вычислять максимум только один раз здесь.

Ответ 2

Здесь приведена измененная версия вашего кода, которая позволит вам увидеть, используется ли повторно maxel:

import Debug.Trace

ismaxl :: (Ord a) => [a] -> a -> Bool
ismaxl l x = x == maxel
           where maxel = trace "Hello" $ maximum l

main = do
  let mylist = [1, 2, 3, 5]
  let ismax = ismaxl mylist
  --Is each call O(1)?  Does each call remember maxel?
  let c1 = ismax 1
  let c2 = ismax 2
  let c3 = ismax 3
  let c5 = ismax 5
  putStrLn (show [c1, c2, c3, c5])

Вы увидите, что maxel не "запоминается" между приложениями.

В общем, вы не должны ожидать, что Haskell начнет делать сокращения до тех пор, пока все аргументы не будут переданы функции.

С другой стороны, если вы включили агрессивную оптимизацию, трудно предсказать, что конкретно сделает конкретный компилятор. Но вы, вероятно, не должны полагаться на какую-либо часть компилятора, которую трудно предсказать, когда вы можете легко переписать код, чтобы сделать то, что вы хотите явно.

Ответ 3

Создав другие хорошие ответы, GHC не стремился выполнить такую ​​оптимизацию в моем опыте. Если я не могу легко сделать что-то бесшумное, я часто прибегал к написанию со смешением связанных варов на LHS и лямбда:

ismaxl :: (Ord a) => [a] -> a -> Bool
ismaxl l = \x -> x == maxel
           where maxel = maximum l

Мне не нравится этот стиль, но он гарантирует, что maxel разделяется между вызовами частично примененного ismaxl.

Ответ 4

Мне не удалось найти такое требование в Haskell Report, и на самом деле GHC, похоже, не выполняет эту оптимизацию по умолчанию.

Я изменил вашу функцию main на

main = do
  let mylist = [1..99999]
  let ismax = ismaxl mylist
  let c1 = ismax 1
  let c2 = ismax 2
  let c3 = ismax 3
  let c5 = ismax 5
  putStrLn (show [c1, c2, c3, c5])

Простые профилирования показывают (на моем старом Pentium 4):

$ ghc a.hs
$ time ./a.out 
[False,False,False,False]

real    0m0.313s
user    0m0.220s
sys     0m0.044s

Но когда я меняю определение c2, c3 и c5 на let c2 = 2 == 99999 и т.д. (оставляя c1 как есть), я получаю

$ ghc a.hs
$ time ./a.out 
[False,False,False,False]

real    0m0.113s
user    0m0.060s
sys     0m0.028s