×

大数据

Hadoop云服务之战:微软vs.亚马逊(hadoop aws)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-04-30 浏览2985 评论0
Hadoop逐渐普及的背后主要的驱动力在于大数据和社交计算的炒作,广泛的企业级开源软件应用,拥有Hadoop熟练技能的开发人员资源池以及Hadoop可以用预期达成的性能以低廉的商业服务器集群成本交付高可用性。后面的这个性能让企业能够将Hadoop工作负载部署到IaaS和PaaS提供商的云上,代替数据中心资本投资中的几次付费费用。

大数据

大数据昌盛期或许犯下的那些过错(大数据爆发前仍需度过两大瓶颈)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-04-30 浏览4286 评论0
你知道我的意思,这段时间,我们比之前花了很多的时间和精力收集,分析,诠释和解释。事实上,与实际表达结果相比,员工把更多的精力投入到准备分析数据上。更糟糕的是,在某些情况下,组织者们正坐在大量数据的财富宝座下,这些数据本可以转变成新的收入机会,但是他们没有用它来做什么,因为他们根本就没有时间和资源来使用它。

大数据

Hadoop 2.0 NameNode HA和Federation实践(Hadoop namenode)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-04-30 浏览3950 评论0
天云趋势在2012年下半年开始为某大型国有银行的历史交易数据备份及查询提供基于Hadoop的技术解决方案,由于行业的特殊性,客户对服务的可用性有着非常高的要求,而HDFS长久以来都被单点故障的问题所困扰,直到Apache Hadoop在2012年5月发布了2.0的alpha版本,其中MRv2还很不成熟,可HDFS的新功能已经基本可用,尤其是其中的的High Availability(以下简称HA)和Federation。Cloudera也于7月制作了CDH4.0.1,包含了Hadoop 2.0的诸多新功能和组件,于是我们就基于CDH4.0.1进行了HA和Federation的测试。此工作由我和同事张军、钱兴会共同完成。

大数据

一个优雅地探索相关性的新可视化方法(一个优雅地探索相关性的新可视化方法是什么)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-04-30 浏览3692 评论0
本文介绍了太阳系相关图,并把它作为对这个过程的一个高级抽象,来创建可以解决实际探索性数据分析问题的新型可视化方法。当你在讲述数据的故事时,你可以探索读者未曾看过的新奇的可视化世界。让你的新奇创意吸引读者并帮助扩展数据科学家的视觉类比方法。