Relative Content

Tag Archive for dataframepysparkapache-spark-sqlflat-file

PySpark equivalent of Spark sliding() function

I have a multiline flat file which I wish to convert to an rdd/dataframe as a 4 column dataframe, or rdd array via PySpark. The Spark code is,