Hive入门教程(二):Hive 的安装部署教程
《大数据技术入门级系列教程》是继《Spring Cloud 微服务入门教程》系列以后,我计划开启第二个连续更新的入门级教程,其中包括大数据数据仓库的概念、Hadoop入门教程、Zookeeper入门教程、Hive入门教程、Flume入门教程、Kafka入门教程、Hbase入门教程、Sqoop入门教程、Oozie入门教程、azkaban入门教程、Kylin入门教程、CDH入门教程、Impala入门教程、Hue入门教程、ClickHouse入门教程、Kettle入门教程、Ambari入门教程、ELK入门教程、Scala入门教程、Flink入门教程,以上入门教程都面向入门级别的人员,主要讲解大数据平台的的搭建和使用,不深入讨论各自的技术点。
此系列教程是伴随我自己自学的过程一起跟大家分享学习的记录和经验,如果有什么错误还请指正,如果您也希望分享您的经验和见解,欢迎到社区论坛讨论交流:https://bbs.renfei.net/forum-50-1.html。
此入门级教程系列直接从Hadoop搭建开始,在这之前还应该学习Web基础、Java基础、Maven以及Spring的基础,还有Redis和MySQL的基础,还有Linux的基础知识,由于我个人的原因这些基础知识我都基本具备,就不再从头赘述了,默认您已经掌握了这些基础知识,咱们直接从大数据平台搭建开始说,要不然真的没个头。
由于大数据平台的组件众多,此系列的教程可能需要非常久的时间来更新,所以先创建这个博文作为目录索引,再未来我更新的时候将会更新此文章作为目录索引使用,您可以收藏此页面作为日后索引使用。
以下是索引目录,将伴随更新进度实时更新下面的索引目录:
数据仓库基本概念 数据仓库的概念(一):什么是数据仓库与数据库有什么不同 数据仓库的概念(二):数据仓库的分层设计 数据仓库的概念(三):数据模型设计事实表、维度表、星型模型、雪花模型 数据仓库的概念(四):全量表、增量表、拉链表、流水表、快照表
Hadoop入门级教程 Hadoop入门教程(一):Hadoop 是什么 Hadoop 由什么组成 Hadoop入门教程(二):Hadoop 的安装教程 Hadoop入门教程(三):Hadoop 单节点本地运行与伪分布式 Hadoop入门教程(四):Hadoop 完全分布式集群环境 Hadoop入门教程(五):HDFS 分布式文件系统 Hadoop入门教程(六):Hadoop API 使用编程的方式操作 HDFS Hadoop入门教程(七):HDFS 数据读写流程 Hadoop入门教程(八):DataNode 工作原理 Hadoop入门教程(九):本地搭建 Hadoop 开发环境 Hadoop入门教程(十):初见 MapReduce 分布式计算 Hadoop入门教程(十一):编程的方式使用 MapReduce 实现 WordCount 案例 Hadoop入门教程(十二):Hadoop 的 Writable 类 Hadoop入门教程(十三): Hadoop MapReduce 的切片与并行 Hadoop入门教程(十四):Hadoop MapReduce Shuffle 机制
Zookeeper入门教程 Zookeeper入门教程(一):Zookeeper简介与安装教程 Zookeeper入门教程(二):Zookeeper API 编程操作教程 Zookeeper入门教程(三):监听节点动态的小案例 Zookeeper入门教程(四):走进 Zookeeper 内部
Hive入门教程 Hive入门教程(一):初次见面 Hive 简介 Hive入门教程(二):Hive 的安装部署教程 Hive入门教程(三):Hive 的数据类型