• 内容详情
  • EasyHadoop实战手册 让你的Hadoop应用飞起来学习教程

    EasyHadoop集群部署入门

    1. 文档概述

    2. 背景

    3. 名词解释

    4. 服务器结构
    #Hadoop试验集群的部署结构
    #系统和组建的依赖关系
    #生产环境的部署结构

    5. Red hat Linux基础环境搭建
    #linux 安装 (vm虚拟机)
    #配置机器时间同步
    #配置机器网络环境
    #配置集群hosts列表
    #下载并安装 JAVA JDK系统软件
    #生成登陆密钥
    #创建用户账号和Hadoop部署目录和数据目录
    #检查基础环境

    6. Hadoop 单机系统 安装配置
    #Hadoop 文件下载和解压
    #配置 hadoop-env.sh 环境变量
    #Hadoop Common组件 配置 core-site.xml
    #HDFS NameNode,DataNode组建配置 hdfs-site.xml
    #配置MapReduce - JobTracker TaskTracker 启动配置
    #Hadoop单机系统,启动执行和异常检查
    #通过界面查看集群部署部署成功
    #通过执行 Hadoop pi 运行样例检查集群是否成功
    #安装部署 常见错误

    7. Hadoop 集群系统 配置安装配置
    #检查node节点linux 基础环境是否正常,参考 [ linux 基础环境搭建]一节。
    #配置从master 机器到 node 节点无密钥登陆
    #检查master到每个node节点在hadoop用户下使用密钥登陆是否正常
    #配置master 集群服务器地址 stop-all.sh start-all.sh 的时候调用
    #通过界面查看集群部署部署成功
    #通过执行 Hadoop pi 运行样例检查集群是否成功

    8. 自动化安装脚本
    #master 服务器自动安装脚本

    Hive仓库集群部署入门

    1. 名词解释

    2. Hive的作用和原理说明
    #数据仓库结构图
    #Hive仓库流程图
    #hive内部结构图

    3. Hive 部署和安装
    #安装Hadoop集群,看EasyHadoop安装文档。
    #安装Mysql,启动Mysql,检查gc++包。
    #解压Hive包并配置JDBC连接地址。
    #启动Hive thrift Server。
    #启动内置的Hive UI。

    4. Hive Cli 的基本用法
    #登陆查询
    #查询文件方式
    #命令行模式

    5. HQL基本语法 (创建表,加载表,分析查询,删除表)
    #创建表

    6. 使用Mysql构建简单数据集市
    #Mysql的两种引擎介绍
    #创建一个数据表使用Hive cli 进行数据分析
    #使用shell 编写Hsql 并使用HiveCli导出数据,使用Mysql命令加载到数据库中。
    #使用crontab 新增每日运行任务定时器

    7. 使用FineReport 数据展现数据
    #安装FineReport,使用注册码!
    #使用FineReport,快速展现数据报表。
    #FineReport 的问题和局限

    1. 全库网所有资源均来源于用户上传和网络,如有侵权请发送邮箱联系站长处理!
    2. 如果你有好的资源或者原创教程,可以到审核区投稿发布,分享会有钻石奖励和额外收入!
    3. 全库网所有的源码、教程等其它资源均源于用户上传发布,如有疑问,可直接联系发布作者处理
    4. 如有链接无法下载、失效或广告,请联系全库网管理员核实处理!
    5. 通过发布原创教学视频或优质源码资源可以免费获得全库网站内SVIP会员噢
    6.全库网管理猿邮箱地址:admin@qkuser.com,我们会在收到您的邮件后三个工作日内完成处理!
    7. 如遇到加密压缩包,默认解压密码为"qkuser.com",如遇到无法解压的请联系管理员!

    全库网 » EasyHadoop实战手册 让你的Hadoop应用飞起来学习教程