spark - 星花园站长资源网

PyQt4 PySide 输入对话框 脚本之家

I was recommended this web site by my co...

...

还有 59 人发表了评论加入8213人围观

scala

scala的至简原则（scala定义方法）

dfgdg 发表于2024-05-22 浏览4994 评论0

1）至简原则细节（1）return可以省略，Scala会使用函数体的最后一行代码作为返回值（2）如果函数体只有一行代码，可以省略花括号（3）返回值类型如果能够推断出来，那么可以省略（:和返回值类型一起省略）（4）如果有return，则不能省略返回值类型，必须指定（5）如果函数明确声明unit，那么即使函数体中使用return关键字也不起作用（6）Scala如果期望是无返回值类型，可以省略等号（7）如果函数无参，但是声明了参数列表，那么调用时，小括号，可加可不加（8

scala

spark java集合转scala_将List转换为dataframe spark scala

渲之你 发表于2024-05-22 浏览4155 评论0

List(“a”,“b”,“c”,“d”)表示具有一个字段的记录,因此结果集在每行中显示一个元素. 要获得预期的输出,该行应该包含四个字段/元素.因此,我们将列表包装为List((“a”,“b”,“c”,“d”)),它代表一行,包含四个字段. 以类似的方式,具有两行的列表作为List((“a1”,“b1”,“c1”,“d1”),(“a2”,“b2”,“c2”,“d2”)) scala> val list = sc.parallelize(List(("a", "b", "c",

scala

Spark大数据实战之五：Spark安装（spark的安装与使用）

温暖记忆 发表于2024-05-22 浏览3056 评论0

1、下载解压spark安装包 Apache官网下载Spark，拖拽到master节点上lala用户目录下，解压 https://archive.apache.org/dist/spark/spark-1.4.0/ 执行如下语句进行解压缩 tar -zvxf spark-1.4.0-bin-hadoop2.4.tgz 2、配置Spark-env.sh (1) 进入spark-1.4.0-bin-hadoop2.4/conf，复制其中的spark-env.sh.template

scala

创建项目并初始化业务数据——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（六）

和煦的糖果风 发表于2024-05-22 浏览6275 评论0

系列文章目录初识推荐系统——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（一）利用用户行为数据——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（二）项目主要效果展示——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（三）项目体系架构设计——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（四）基础环境搭建——基于Spark平台的协同过滤实时电影推荐系统项目系列博客（五）创建项目并初始化业务数据——基于Spark平台的协同过滤实时电影推荐

scala

spark3.0.1-bin-hadoop3.2安装（win10伪环境版）（hadoop3.1.4安装）

LJY 发表于2024-05-21 浏览6038 评论0

下载 spark-3.0.1-bin-hadoop3.2.tgz scala-2.13.4.zip Anaconda3-2020.11-Windows-x86_64.exe pyspark-3.0.1.tar.gz py4j-0.10.9.tar.gz 解压解压spark到D:\servers\spark-3.0.1-bin-hadoop3.2 解压scala到D:\servers\scala-2.13.4 配置 SPARK_HOME=D:\servers

scala

详细讲解RDD概念以及核心结构（简述RDD概念）

雪先生 发表于2024-05-21 浏览4793 评论0

前言本期将介绍 Spark 中一个抽象的概念——RDD，要学习 Spark 就必须对 RDD 有一个清晰的认知，RDD是 Spark 中最基本的数据抽象，代表一个不可变、可分区、元素可并行计算的集合。本期学习目标 RDD 的概念 RDD 的特点 RDD 的核心结构 RDD的概念 RRD全称叫做弹性分布式数据集（Resilient Distributed Dataset），从它的名字中可以拆解出三个概念。 Resilient ：弹性的，包括存储和计算

scala

Spark05：【案例】单词计数：Scala代码和Java代码实现以及任务提交的几种方式

?俊码 发表于2024-05-21 浏览4910 评论0

一、单词计数首先看来一个快速入门案例，单词计数这个需求就是类似于我们在学习MapReduce的时候写的案例需求这样的：读取文件中的所有内容，计算每个单词出现的次数这个需求就没什么好分析的了，咱们之前在学习MapReduce的已经分析过了，接下来就来看一下使用Spark需要如何实现。注意：由于Spark支持Java、Scala这些语言，目前在企业中大部分公司都是使用Scala语言进行开发，个别公司会使用java进行开发，为了加深大家对Spark的理解，也满足java老程序员的需

scala

Spark-sql 通过case class、class和StructType的方式创建DataFrame

jmgm502 发表于2024-05-21 浏览4913 评论0

1.通过case class 的方式创建DataFrame laozhao,18,9999.99 laoduan,30,99.99 xuance,28,99.99 yeqing,25,99.0 dezhi,24,99.9 libai,88,50.0 banzang,29,50.6 import org.apache.spark.SparkContext import org.apache.spark.rdd.RDD import org.apache.spark.sql.{Dat

scala

Scala，spark，Kafka，storm配置（1+x）

行者 发表于2024-05-21 浏览5655 评论0

目录 Scala与spark部署 Kafka部署 Storm部署 Scala与spark部署配置环境变量解压文件改名生效环境变量检验Scala是否能使用按CTRL+C退出配置spark文件新建文件并写入分发环境变量，并到另外两台机器使环境变量生效分发文件三台机器启动z

scala

spark在yarn集群上执行client模式代码 Container killed on request. Exit code is 143 Container exited with a no

Mc 发表于2024-05-21 浏览5618 评论0

spark在yarn集群上执行client模式代码启动历史服务 bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master yarn \ --deploy-mode client \ ./examples/jars/spark-examples_2.12-3.0.0.jar \ 10 出现问题： [2021-03-15 20:36:42.553]Container killed on request. E

scala

源码解析Spark各个ShuffleWriter的实现机制（四）——UnsafeShuffleWriter

?? 发表于2024-05-21 浏览4990 评论0

基于3.2源码。 UnsafeShuffleWriter的应用场景它用在对序列化数据直接排序的场景，避免了将数据反序列化后排序，再序列化的开销。它是对数据的分区id进行排序，并不会对数据的key排序。这个shuffle方式大量使用到了sun.misc.Unsafe来与操作系统打交道，直接操作内存。实现整体流程 UnsafeShuffleWriter的实现封装地看起来十分简单： // UnsafeShuffleWriter public void write(scala

scala

spark配置（spark配置参数详解）

UPARK 发表于2024-05-21 浏览5674 评论0

前提：关闭防火墙禁止下次开机启动，并不会关闭防火墙命令 : chkconfig iptables off 关闭防火墙命令： service iptables stop contos7 关闭防火墙命令 sudo systemctl stop firewalld.service 一、上传 scala-2.10.4.zip 和 spark-2.0.2-bin-hadoop2.6.tgz 包并解压目录：D:\java\1笔记资料及资源\大数据Ha

« 2023年9月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

控制面板

您好，欢迎到访网站！
查看权限

网站分类

最近发表

最新留言

文章归档

2022年2月 (2538)

友情链接