×

scala

08-UDFs

Peter Peter 发表于2024-04-15 浏览5371 评论0
User-Defined Functions Define a function Create and apply UDF Register UDF to use in SQL Use Decorator Syntax (Python Only) Use Vectorized UDF (Python Only) Methods UDF Registration (spark.udf): register Built-In Functions : udf

scala

数据分析工具选Python还是Scala?我们帮你解决选择困难症

Langhing Langhing 发表于2024-04-15 浏览4211 评论0
做数据分析时,如果需要编程,会面临一个数据分析工具选择的问题:选择Scala,还是Python? 一般给的建议是小数据用Python,大数据用Scala,当然是基于Spark平台的Scala,因为JVM的加持,Scala的性能相较于Python快10倍,Scala是函数式编程语言,主打简洁、性能;python主打过程式,易用、胶水,生态完整,是AI时代的御用语言,而且可以使用的数据处理基础库比较多,最流行的当然是Pandas。 先说下历史, 图灵,不但完成了二战密码破解任务,而且是计算机理论

scala

Scala函数式编程(Scala函数式编程器不可变性)

哄哄 哄哄 发表于2024-04-15 浏览4513 评论0
一、函数式编程定义: Scala是一门既面向对象,又面向过程的语言。在Scala中,函数与类、对象地位是一样,所以说scala的面向过程其实就重在针对函数的编程 了,所以称之为函数式编程 在Scala中定义函数需要使用 def 关键字,函数包括函数名、参数、函数体 Scala要求必须给出函数所有参数的类型,但是函数返回值的类型不是必须的,因为Scala可以自己根据函 数体中的表达式推断出返回值类型, 函数中最后一行代码的返回值就是整个函数的返回值,不需要使用return 二、函数赋值

scala

spark环境安装及配置详细(附带相关错误及解决办法)(spark的安装与使用)

情侣 情侣 发表于2024-04-15 浏览4145 评论0
安装spark之前需要成功安装scala 解压安装包 更改名字 修改环境变量 使环境变量生效 修改配置文件 进入spark目录 进入conf 查看文件 更改文件名称 将spark-env.sh.template、slaves.template分别替换为spark-env.sh、slaves: 配置slaves 配置spark-env.sh 注意:8021端口,相当于hadoop3内部通信的8020端口,此处的端口需要确

scala

【Spark】【复习】Spark入门考前概念相关题复习(spark选择题)

漂泊 漂泊 发表于2024-04-15 浏览5162 评论0
Spark考前概念相关题复习 AUthor:萌狼蓝天 哔哩哔哩:萌狼蓝天 博客园:我的文章 - 萌狼蓝天 博客:萌狼工作室 - 萌狼蓝天 (mllt.cc) 选择题 Hadoop 1.HADOOP的三大核心组件 HDFS分布式文件系统 YARN作业调度 和 集群资源管理的框架 MAPREDUCE 分布式运算编程框架 2.hadoop完全分布式集群主节点上的角色有 NameNode ResourceManager Seconda

scala

【RDD】创建RDD及读取文件(rdd写入文件)

小海 小海 发表于2024-04-15 浏览2936 评论0
最近项目中需要做的数据处理相对复杂,自己浅显的scala知识已经不够用了,打算每天来学习一点点。这里感谢yihan大佬在解决问题中给到的巨大帮助!感谢生命中遇到的每个贵人! 创建RDD Spark shell提供了SparkContext变量sc,使用sc.parallelize()创建RDD。 scala> val rdd = sc.parallelize(Array(1,2,3,4,5,6,7,8,9,10)) rdd: org.apache.spark.rdd.RDD[In

scala

Scala 程序使用 JNI 技术调用 C++ 程序

sb70770 sb70770 发表于2024-04-15 浏览6121 评论0
scala程序调用C++的方法其实和java调用C++的方法类似,有少许的区别。 1、首先,在 IDEA 中创建 scala 程序,如:实现 scala 程序中 调用 c++ 实现 输入 input ,最后输出 result = input * input。即求一个数的平方。如图所示 class Sample1 { // --- Native methods @native def intMethod(n: Int): Int def loadLibrary(libName

scala

scala语言介绍(Scala 语言)

梅菜扣肉 梅菜扣肉 发表于2024-04-15 浏览7193 评论0
什么是Scala scala(Scalable Language)是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。 Scala运行于Java平台(java虚拟机上),并兼容现有的Java程序。 面向对象(将对象当作参数传来传去) + 面向函数(方法,可以将函数当作参数传来传去) 为什么要学Scala 优雅:这是框架设计师第一要考虑的 速度快 Spark就是使用Scala编写的,因此为了更好的学习Spark,需要掌握Scala这门语言 =Spark的兴起,带动Sc

scala

Spark core组件介绍(spark core的基本功能)

DomyselfYuzhendong DomyselfYuzhendong 发表于2024-04-15 浏览4937 评论0
1、RDD介绍 Spark的核心是建立在统一的弹性分布式数据集(Resilient Distributed Datasets,RDD)之上的,这使得Spark的各个组件可以无缝的进行集成,能够在同一个应用程序中完成大数据处理。 RDD实际上是对一个分布式数据集的抽象,从物理存储上看,一个数据集可能被分为多个分区,各个分区都有可能存放在不同的存储/计算节点上,而RDD则是在该数据集上的一个抽象,代表了整个数据集,但这个RDD并不会从物理上将数据放在一起。 有了RDD这个抽象,用户可