Подтвердить что ты не робот

Как использовать IO с Iteratees Scalaz7 без?

Рассмотрим этот код (взятый из здесь и модифицированный для использования байтов, а не строк символов).

import java.io.{ File, InputStream, BufferedInputStream, FileInputStream }
import scalaz._, Scalaz._, effect._, iteratee.{ Iteratee => I, _ }
import std.list._

object IterateeIOExample {
  type ErrorOr[+A] = EitherT[IO, Throwable, A]

  def openStream(f: File) = IO(new BufferedInputStream(new FileInputStream(f)))
  def readByte(s: InputStream) = IO(Some(s.read()).filter(_ != -1))
  def closeStream(s: InputStream) = IO(s.close())

  def tryIO[A, B](action: IO[B]) = I.iterateeT[A, ErrorOr, B] {
    EitherT(action.catchLeft).map(r => I.sdone(r, I.emptyInput))
  }

  def enumBuffered(r: => BufferedInputStream) = new EnumeratorT[Int, ErrorOr] {
    lazy val reader = r
    def apply[A] = (s: StepT[Int, ErrorOr, A]) => s.mapCont(k =>
      tryIO(readByte(reader)) flatMap {
        case None => s.pointI
        case Some(byte) => k(I.elInput(byte)) >>== apply[A]
      })
  }

  def enumFile(f: File) = new EnumeratorT[Int, ErrorOr] {
    def apply[A] = (s: StepT[Int, ErrorOr, A]) =>
      tryIO(openStream(f)).flatMap(stream => I.iterateeT[Int, ErrorOr, A](
        EitherT(
          enumBuffered(stream).apply(s).value.run.ensuring(closeStream(stream)))))
  }

  def main(args: Array[String]) {
    val action = (
      I.consume[Int, ErrorOr, List] &=
      enumFile(new File(args(0)))).run.run
    println(action.unsafePerformIO())
  }
}

Запуск этого кода в файле приличного размера (8kb) создает исключение StackOverflowException. Некоторые поиски показали, что исключение можно избежать, используя монадию Trampoline вместо IO, но это не похоже на отличное решение - пожертвовать функциональной чистотой, чтобы программа полностью завершилась. Очевидный способ исправить это - использовать IO или Trampoline в качестве Monad Transformer для переноса другого, но я не могу найти реализацию трансформаторной версии любого из них, и мне не хватает гуру функционального программирования для знаю, как писать свои собственные (более подробная информация о FP является одной из целей этого проекта, но я подозреваю, что создание новых монадных трансформаторов немного выше моего уровня на данный момент). Полагаю, я мог бы просто обернуть большое действие IO вокруг создания, запуска и возврата результата моих итераций, но это похоже на более обходное решение, чем решение.

Предположительно, некоторые монады не могут быть преобразованы в монадные трансформаторы, поэтому я хотел бы знать, возможно ли работать с большими файлами без сброса ввода-вывода или, и если да, то как?

Бонусный вопрос: я не могу придумать никакого способа для итерации, чтобы сигнализировать, что он столкнулся с ошибкой во время обработки, за исключением того, что он возвратил Либо, что упрощает их компоновку. В приведенном выше коде показано, как использовать EitherT для обработки ошибок в перечислителе, но как это работает для итераций?

4b9b3361

Ответ 1

После создания исключений и печати их длины стека в разных местах вашего кода я чувствовал, что ваш код не переполнен. Кажется, что все работает в постоянном размере стека. Поэтому я искал другие места. В конце концов я скопировал реализацию consume и добавил некоторую печать глубины стека и подтвердил, что она переполнена там.

Итак, это переполнение:

(I.consume[Int, Id, List] &= EnumeratorT.enumStream(Stream.fill(10000)(1))).run

Но я тогда узнал, что это не так:

(I.putStrTo[Int](System.out) &= EnumeratorT.enumStream(Stream.fill(10000)(1)))
  .run.unsafePerformIO()

putStrTo использует foldM и как-то не вызывает переполнение. Поэтому мне интересно, можно ли реализовать consume с точки зрения foldM. Я только что скопировал несколько вещей из употребления и изменил до тех пор, пока не составил:

def consume1[E, F[_]:Monad, A[_]:PlusEmpty:Applicative]: IterateeT[E, F, A[E]] = {
  I.foldM[E, F, A[E]](PlusEmpty[A].empty){ (acc: A[E], e: E) =>
    (Applicative[A].point(e) <+> acc).point[F]
  }
}

И это сработало! Печать длинного списка объектов.