Scala是Scalable Language的简称,它是一门多范式的编程语言,其设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。查看全文>>
大多数的Scala开发程序员都会选择IDEA作为开发Scala的工具。接下来,以Window操作系统为例,分步骤讲解如何在IDEA工具上下载安装Scala插件,具体步骤如下:查看全文>>
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式数据库,它起源于2006年Google发表的BigTable论文。在2008年,PowerSet的Chad Walters和Jim Keller受到了该论文思想的启发,从而把HBase作为Hadoop的子项目来进行开发维护,用于支持结构化的海量数据存储。查看全文>>
Sqoop是Apache旗下的一款开源工具,该项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,并在2013年,独立成为Apache的一个顶级开源项目。查看全文>>
想要通过外部UI界面访问虚拟机服务,还需要对外开放配置Hadoop集群服务端口号。为了后续学习方便,就直接将所有集群节点防火墙进行关闭即可,具体操作如下。查看全文>>
MapReduce的核心思想是“分而治之”。所谓“分而治之”就是把一个复杂的问题,按照一定的“分解”方法分为等价的规模较小的若干部分,然后逐个解决,分别找出各部分的结果,把各部分的结果组成整个问题的结果,这种思想来源于日常生活与工作时的经验,同样也完全适合技术领域。查看全文>>