Spark
https://spark.apache.org/docs
Apache Spark as a central tool for mining and analytics in big data.
Spark使用DAG(有向无环图)模型作为其执行模型, 并且主要使用内存计算的方式进行任务计算。
Spark基于一套统一的数据模型(RDD)和编程模型(Transformation/Action)。
Spark是Apache软件基金会的顶级项目, 在Hadoop Ma
1 下载Spark
下载和解压缩,首选下载预编译版本的Spark,访问:Spark download,选择包类型为:“Pre-built for Apache Hadoop 3.2 and later",然后直接下载Spark包:spark-3.1.2-bin-hadoop3.2.tgz。下载好后,对包进行解压缩,并且进入到spark目录中:
cd ~
tar -xf spark-3.1.2-bin-hadoop3.2.tgz
cd spark-3.1.2-bin-hadoop3.