博客
关于我
伪分布式安装Hadoop详解
阅读量:377 次
发布时间:2019-03-05

本文共 1535 字,大约阅读时间需要 5 分钟。

伪分布式安装Hadoop

今天,我尝试了伪分布式安装Hadoop,过程虽然有些波折,但最终还是完成了。以下是我记录的安装过程和思考。

第一步是上传并解压Hadoop的安装包。通过命令tar -zxvf hadoop-2.7.3.tar.gz -C /opt/modules/,我将解压包放在了指定的目录下。解压完成后,我进入了下一步。

接下来,我需要了解Hadoop的目录结构,并删除一些无用的文件。通过浏览文件目录,我发现了一些不必要的文件,于是我决定将它们删除,以优化存储空间。

然后是配置Hadoop的环境变量。根据文档,我在hadoop-env.shyarn-env.shmapred-env.sh中设置了JAVA_HOME/opt/modules/jdk1.8.0_91。这些环境变量的设置对后续的Hadoop运行至关重要。

在配置Hadoop时,我按照模块进行了设置。首先是HDFS模块,我在core-site.xml中指定了fs.defaultFShdfs://bigdata-training01.huadian.com:8020,并将临时存储目录设置为/opt/modules/hadoop-2.7.3/etc/hadoop/data/tempData。接着,在hdfs-site.xml中,我将dfs.replication设置为1,因为这是一个伪分布式环境,副本数量不需要过多考虑。

接下来是YARN模块的配置。在yarn-site.xml中,我设置了yarn.resourcemanager.hostnamebigdata-training01.huadian.com,并指定了yarn.nodemanager.aux-servicesmapreduce_shuffle,以便支持MapReduce程序的运行。

安装完成后,我需要测试HDFS和YARN的运行状态。通过查看进程管理器jps,我确认了Hadoop的各个组件是否正常运行。此外,我还通过访问HDFS的Web界面(如bigdata-training01.huadian.com:50070)确认了HDFS的状态是否正常。

为了验证HDFS的功能,我执行了几个基本命令:创建目录、上传文件、查看文件和删除文件。这些操作都完成得很顺利,证明了HDFS的正常性。

在YARN方面,我测试了MapReduce程序的运行。通过运行bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /datas/input.data /datas/output/output001,我验证了MapReduce程序的正确性。结果显示,程序能够成功运行并将输出写入指定目录。

最后,我对Hadoop的日志聚集功能进行了配置。在yarn-site.xml中,我添加了以下配置:

yarn.log-aggregation-enable
true
yarn.log-aggregation.retain-seconds
604800

通过这些配置,YARN将自动聚集任务日志到HDFS指定目录下,以便后续的监控和分析。

整个安装过程让我对Hadoop的伪分布式部署有了更深入的理解。虽然中途遇到了一些问题,但通过仔细查看日志和调整配置,最终问题得到了解决。安装过程中,我也学会了如何通过命令行工具进行故障排除,这对我以后进行更复杂的系统操作将非常有帮助。

转载地址:http://cvig.baihongyu.com/

你可能感兴趣的文章
oracle 行转列
查看>>
Oracle 表
查看>>
Oracle 递归
查看>>
oracle 逻辑优化,提升高度,综合SQL上下文进行逻辑优化
查看>>
oracle 闪回关闭,关闭闪回即disable flashback的操作步骤
查看>>
oracle 限制用户并行,insert /*parallel */ 到不同用户,并行起不来的问题
查看>>
oracle--用户,权限,角色的管理
查看>>
oracle00205报错,Oracle控制文件损坏报错场景
查看>>
Oracle10g EM乱码之快速解决
查看>>
Oracle10g下载地址--多平台下的32位和64位
查看>>
Oracle10g安装了11g的ODAC后,PL/SQL连接提示TNS:无法解析指定的连接标识符
查看>>
Oracle11G基本操作
查看>>
Oracle11g服务详细介绍及哪些服务是必须开启的?
查看>>
Oracle11g静默安装dbca,netca报错处理--直接跟换操作系统
查看>>
oracle12安装软件后安装数据库,然后需要自己配置监听
查看>>
Oracle——08PL/SQL简介,基本程序结构和语句
查看>>
Oracle——distinct的用法
查看>>
Oracle、MySQL、SQL Server架构大对比
查看>>
oracle下的OVER(PARTITION BY)函数介绍
查看>>
Oracle中DATE数据相减问题
查看>>