Я знаю, как найти размер файла в scala. Но как найти размер RDD/dataframe в искры?
Scala:
object Main extends App {
val file = new java.io.File("hdfs://localhost:9000/samplefile.txt").toString()
println(file.length)
}
Spark:
val distFile = sc.textFile(file)
println(distFile.length)
но если я обработаю его, не получая размер файла. Как найти размер RDD?