×

scala

大数据技术原理与应用(第十章 Spark)(大数据技术原理与应用第七章)

luxun luxun 发表于2024-05-01 浏览5538 评论0
目录 10.1 Spark简介 Spark的主要特点 Scala简介 Scala的特性 Spark与Hadoop的对比 Hadoop与Spark的执行流程对比 10.2 Spark生态系统 BDAS架构 Spark生态系统组件的应用场景 10.3 Spark运行架构 Spark基本概念和架构设计 RDD DAG Executor Application Task Job Stage Spark运行架构 与Hadoop MapReduce计算框架相比,Spa

scala

Spark 调度系统,内部原来是这样搬砖的

Ai潼泺 Ai潼泺 发表于2024-05-01 浏览5075 评论0
0.前言 大家好,我是小林! 《大数据面试突击系列之 Spark》最近更新有点慢,我最近懒癌太严重了,当热也和近期疫情有关系。 随着疫情逐渐消散,生活也慢慢走向正常,相信你们都已经开工。我始终认为,工作才是我们的常态,所以这个系列,我后续会加快更新频率。 Spark 系列往期文章: 第一篇:RDD 编程模型:延迟计算是怎么回事? 第二篇:Spark 数据依赖图是啥? 第三篇:Spark 进程模型与分布式部署:什么是分布式计算? 第四篇:你管这破玩意儿叫 RDD 的持久化? 今

scala

Scala中的列表List

ㅤ 发表于2024-05-01 浏览6048 评论0
Scala 列表类似于数组,它们所有元素的类型都相同, 但是它们也有所不同:列表是不可变的,值一旦被定义了就不能改变,                                     其次列表 具有递归的结构(也就是链接表结构)而数组不是。     scala中的list是一个不可变的列表,有时候我们想直接添加对象不太方便,这个时候可以先转成java的List添加完再转回去.   LIst支持在头部快速添加和移除条目,但是不提供快速按下标访问的功能,这个功能需要线性遍历列。

scala

最佳在线 Java 编译器和编辑器(最佳在线 java 编译器和编辑器区别)

玉灵子 玉灵子 发表于2024-05-01 浏览6090 评论0
  在线 java 编译器的功能范围可以从将 .java 文件转换为 .class 文件的简单转换器到可用于管理 java 项目的基于云的综合在线 java IDE。   市场上的顶级 Java 编译器   JDoodle   JDoodle 具有简单而简约的用户界面。你可以在浏览器中修改 Java 代码、保存、执行、调试、与他人共享等等。它包括学习编程基础知识或执行教科书、课程和程序中的代码示例所需的所有基本 Java 库。   但是,如果你需要安装任何第三方库或框架,只需单击几下即可

scala

5.Spark 学习成果转化—机器学习—使用Spark ML的线性回归来预测商品销量 (线性回归问题)

零距离 零距离 发表于2024-05-01 浏览8552 评论0
第5例 使用Spark ML的线性回归来预测商品销量 这是一个 线性回归 问题。 有关 Spark ML 的介绍与知识点请参考: Spark ML学习笔记—Spark MLlib 与 Spark ML。 5.1 数据准备 5.1.1 数据集文件准备 (1) 该项目并为使用数据库当做数据源,而是直接将数据文件放在项目目录中, 这是一个结构化的简化数据集。 (2) 本项目使用的数据集 house.csv 将在本博客末尾处给出。 5.1.2 数据集字段解

scala

java stream order by_Java Stream 使用详解

renhai renhai 发表于2024-05-01 浏览9886 评论0
Stream是 Java 8新增加的类,用来补充集合类。 Stream代表数据流,流中的数据元素的数量可能是有限的,也可能是无限的。 Stream和其它集合类的区别在于:其它集合类主要关注与有限数量的数据的访问和有效管理(增删改),而Stream并没有提供访问和管理元素的方式,而是通过声明数据源的方式,利用可计算的操作在数据源上执行,当然BaseStream.iterator()和BaseStream.spliterator()操作提供了遍历元素的方法。 Java Stream提供了提

scala

遇到问题--scala-gradle--Connect to jcenter.bintray.com:443 [jcenter.bintray.com/34.95.74.180] failed: co

′T-oste ′T-oste 发表于2024-05-01 浏览5005 评论0
情况 项目编译使用gradle进行打包,之前都能正常运行,在没有改动的情况下, 突然报错gradle命令无法成功构建。 在ci文件中使用方式如下: deploy-test: image: 123.dkr.ecr.cn-northwest-1.amazonaws.com.cn/operation/gradle:4.8_awscli stage: deploy-test script: - gradle shadowJar - /home/gradle/bin/aws s3

scala

chisel快速入门(三)(chisel教程汇总)

山西五际直播基地 山西五际直播基地 发表于2024-05-01 浏览4727 评论0
前一篇见此: chisel快速入门(二)_沧海一升的博客-CSDN博客简单介绍了chisel,使硬件开发者能快速上手chisel。https://blog.csdn.net/qq_21842097/article/details/121418806 十四、模块的功能创建         制造用于模块构造的功能接口也是有用的。例如,我们可以构建一个构造函数,它将多路复用器输入作为参数,并返回多路复用器输出: object Mux2 { def apply (sel: UInt, in0:

scala

Spark之Spark Streaming

●°彩儿﹏ ●°彩儿﹏ 发表于2024-05-01 浏览4436 评论0
Spark Streaming是什么         Spark Streaming用于流式数据处理 DStream是什么         Spark Streaming使用离散化流作为抽象表示,称作DStream,是随着时间的推移而得到的数据的序列。在DStream内部,每个时间区间收到的数据都作为RDD存在,DStream就是由这些RDD所组成的序列,DStream就是对RDD在实时处理场景中的一种封装。 架构图 DStream的创建          1.通过RDD队列

scala

从零开始学Spark(一)(spark自学)

神经蛙 神经蛙 发表于2024-05-01 浏览7403 评论0
点击关注强哥,还有100多G的面试资料等你来拿 哈喽,大家好,我是强哥。 前情提要 没错,从今天开始,强哥将开一个Spark入门系列推文,都让其他推文也还是会继续发。 为什么要学Spark,没有别的,强哥就是觉得这框架牛逼而且热门,现在学大数据,不学Spark你就等于孙悟空飞到如来佛祖的手上没刻“到此一游”并拉上一炮尿一样少了点味道。所以,有兴趣的,就跟着我一起学学,没兴趣的,以后看到我发类似推文标题的自动忽略即可。 迈出第一步 首先,要学Spark,你如果连它是个什么都不懂这个