У меня есть код haskell для разрешения быстрого преобразования Фурье, и я хочу применить данные parallelism к нему. Тем не менее, каждая стратегия, которую я использую, генерирует слишком много искр, и большинство из них переполняются.
Кто-нибудь имеет представление о том, как применить хорошую стратегию данных parallelism по следующему алгоритму:
-- radix 2 Cooley-Tukey FFT
fft::[Complex Float] -> [Complex Float]
fft [a] = [a]
fft as = interleave ls rs
where
(cs,ds) = bflyS as
ls = fft cs
rs = fft ds
interleave [] bs = bs
interleave (a:as) bs = a : interleave bs as
bflyS :: [Complex Float] -> ([Complex Float], [Complex Float])
bflyS as = (los,rts)
where
(ls,rs) = halve as
los = zipWith (+) ls rs
ros = zipWith (-) ls rs
rts = zipWith (*) ros [tw (length as) i | i <- [0..(length ros) - 1]]
halve as = splitAt n' as
where
n' = div (length as + 1) 2
-- twiddle factors
tw :: Int -> Int -> Complex Float
tw n k = cis (-2 * pi * fromIntegral k / fromIntegral n)
PAR MONAD
Ответ от leftaroundabout очень помог мне понять, как применять данные parallelism в коде. Тем не менее, я изучил парную монаду и попытался применить к ней задачу parallelism. Проблема в том, что он работает медленнее, чем исходный bflyS. Я думаю, что код, который я разработал, является способом дорогостоящего создания потоков по сравнению с относительной работой, которую я делаю. Кто-нибудь знает, как лучше использовать парную монаду?
--New Task Parallelism bflyS
bflySTask :: [Complex Float] -> ([Complex Float], [Complex Float])
bflySTask as = runPar $ do
let (ls, rs) = halve as
v1<-new
v2<-new
let ros = DATA.zipWith (-) ls rs
let aux = DATA.map (tw n) [0..n-1]
fork $ put v1 (DATA.zipWith (+) ls rs)
fork $ put v2 (DATA.zipWith (*) ros aux)
los <- get v1
rts <- get v2
return (los, rts)
where
n = DATA.length as