【hadoop】介绍
创始人
2024-06-01 15:23:37
0

目录

介绍

版本

优势

 大数据技术生态体系


介绍

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 解决 存储和分析计算 Google在大数据方面的三篇论文 GFS --->HDFS Map-Reduce --->MR BigTable --->HBase Hadoop创始人Doug Cutting

版本

Hadoop 三大发行版本:Apache、Cloudera、Hortonworks。 http://hadoop.apache.org https://www.cloudera.com/downloads/cdh https://hortonworks.com/products/data-center/hdp/ Apache 版本最原始(最基础)的版本,对于入门学习最好。2006 Cloudera 内部集成了很多大数据框架,对应产品 CDH。2008 Hortonworks 文档较好,对应产品 HDP。2011 Hortonworks 现在已经被 Cloudera 公司收购,推出新的品牌 CDP。

优势

高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元 素或存储出现故障,也不会导致数据的丢失。 高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。 高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处 理速度。 高容错性:能够自动将失败的任务重新分配。 组成

 大数据技术生态体系

 推荐系统

 运行

关闭防火墙和开机自启

systemctl stop firewalld
systemctl disable firewalld.service
注意:在企业开发时,通常单个服务器的防火墙时关闭的。公司整体对外会设置非常安 全的防火墙 修改克隆虚拟机的静态IP
 vim /etc/sysconfig/network-scripts/ifcfg-ens33
DEVICE=ens33
TYPE=Ethernet
ONBOOT=yes
BOOTPROTO=static
NAME="ens33"
IPADDR=192.168.10.102
PREFIX=24
GATEWAY=192.168.10.2
DNS1=192.168.10.2

修改虚拟网络编辑器

修改Windows 系统适配器 VMware Network Adapter VMnet8 的 IP 地址 修改主机名
修改主机名
vim /etc/hostname
配置主机映射hosts文件
vim /etc/hosts192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108重启克隆机
reboot

修改windows

C:\Windows\System32\drivers\etc
hosts 文件
192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108
如果操作系统是 window10,先拷贝出来,修改保存以后,再覆盖即可

安装

cd /opt/software/
tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/sudo vim /etc/profile.d/my_env.sh
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbinsource /etc/profile

目录结构

bin 目录:存放对 Hadoop 相关服务(hdfs,yarn,mapred)进行操作的脚本 etc 目录:Hadoop 的配置文件目录,存放 Hadoop 的配置文件 lib 目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能) sbin 目录:存放启动或停止 Hadoop 相关服务的脚本 share 目录:存放 Hadoop 的依赖 jar 包、文档、和官方案例

相关内容

热门资讯

万众创新的含义,大众创业 万众... 2017年7月27日,国务院发布《国务院关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发...
再谈创业者的价值观(创业的价值... 微信官方账号:第一品牌官无论任何时候,我们都在为中国制造业发出品牌声音!01企业家价值观三十年前就有...
未来的创业趋势是什么,创业失败... 这是我们坚信多年的铁律。如果只看注册公司的统计,创业成功率可能真的只有10%,甚至更低。统计显示,8...
第一次创业开什么店好,怎样开公... 在目前的市场环境下,对于一个刚创业的人来说,项目的选择真的很重要,稍有疏忽就很容易导致创业失败。那么...
企业孵化器,创业加速器是什么意... 创业加速器是一种通过教育引导和提供资金等手段来加速初创企业发展的新型创业模式。它只有很短的历史,但这...
借力REITs“东风” 房企谋... 6月27日,中金中国绿发商业资产REIT上市首日开盘涨幅达30%,触及涨停。这是今年以来消费基础设施...
市委全面深化改革委员会召开第十...   本报讯(记者 祁梦竹 范俊生)昨天下午,市委全面深化改革委员会召开第十五次会议,审议《北京市宏观...
人工智能创业项目,数字创业 人... 随着AI行业的快速发展,数据标注行业无疑是一个十亿美元的市场,数据相当于人工智能算法的“燃料”。作为...
大学生创业新颖的点子,创业意识... 关于孩子在业余时间能否赚到零花钱,有两种声音。一个声音认为,孩子的任务是专心学习,赚钱是大人的事,不...
大学生创业计划书怎么写(计算机... 随着网络经济和电子商务的快速发展,网上创业已经成为广州大学生自主创业的重要途径。接下来,请享受学习。...