×

大数据

来自Twitter的Hadoop优化经历:集群越大越显着!(Hadoop调优)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-05-30 浏览4024 评论0
此文介绍了Twitter的核心数据类库团队,在使用Hadoop处理离线任务时,使用的性能分析方法,及由此发现的问题和优化手段,对如何使用 JVM/HotSpot profile(-Xprof)分析Hadoop Job的方法调用开销、Hadoop配置对象的高开销、MapReduce阶段的排序中对象序列化/反序列的高开销问题及优化等给出了实际可操作的方案。32个赞!

大数据

数据库也要“瘦身”,你知道吗?(sql数据库瘦身)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-05-30 浏览4352 评论0
工业4.0时代,如何应对信息的爆炸式增长?在财务、物料、人力等ERP数据指数增长的背后,形形色色的系统、林林总总的需求同时也导致许多功能模块运行缓慢、响应时间滞后。为了向企业提供稳定的数据库性能,并满足长期保存和访问要求,对数据库性能的优化才是当务之急。

大数据

Hadoop:为什么RAID-0不可?(hadoop raid)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-05-29 浏览3559 评论0
RAID-0又称为Stripe或Striping,其原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。多年应用下来,RAID-0优势很明显。