为什么选择kafka采集数据?大数据采集层主要可以使用Flume, Kafka两种技术。查看全文>>
本地和远程模式安装配置方式大致相同,本质上是将Hive默认的元数据存储介质由自带的Derby数据库替换为MySQL数据库,这样无论在任何目录下以任何方式启动Hive,只要连接的是同一台Hive服务,那么所有节点访问的元数据信息是一致的,从而实现元数据的共享。下面就以本地模式为例,讲解安装过程。查看全文>>
任何一种编程语言都有特定的数据类型,Scala也不例外。与其他语言相比,Scala中的所有值都有一个类型,包括数值和函数。接下来,通过一张图来描述Scala数据类型的层次结构,具体如图1所示。查看全文>>
HBase数据库最常见的操作就是读写数据,接下来,针对HBase读写数据的流程进行详细介绍。查看全文>>
Hadoop集群的安装和配置完成之后。并不能直接启动集群,因为在初次启动HDFS集群时,必须对主节点进行格式化处理,具体指令如下。查看全文>>
大数据不断向世界的各行各业渗透,影响着我们的衣食住行。例如,网上购物时,经常会发现电子商务门户网站向我们推荐商品,往往这类商品都是我们最近需要的。查看全文>>