当前位置: 首页 > news >正文

北京个人网站建设多少钱地推接单网

北京个人网站建设多少钱,地推接单网,北京做网站公司哪家强,白酒网站模版1 Hadoop小文件弊端 HDFS上每个文件都要在NameNode上创建对应的元数据,这个元数据的大小约为150byte,这样当小文件比较多的时候,就会产生很多的元数据文件,一方面会大量占用NameNode的内存空间,另一方面就是元数据文件…

1 Hadoop小文件弊端

  HDFS上每个文件都要在NameNode上创建对应的元数据,这个元数据的大小约为150byte,这样当小文件比较多的时候,就会产生很多的元数据文件,一方面会大量占用NameNode的内存空间,另一方面就是元数据文件过多,使得寻址索引速度变慢。

  小文件过多,在进行MR计算时,会生成过多切片,需要启动过多的MapTask。每个MapTask处理的数据量小,导致MapTask的处理时间比启动时间还小,白白消耗资源。

2 Hadoop小文件解决方案

(1)在数据采集的时候,就将小文件或小批数据合成大文件再上传HDFS(数据源头)

(2)Hadoop Archive(存储方向)
  是一个高效的将小文件放入HDFS块中的文件存档工具,能够将多个小文件打包成一个HAR文件,从而达到减少NameNode的内存使用

(3)CombineTextInputFormat(计算方向)
  CombineTextInputFormat用于将多个小文件在切片过程中生成一个单独的切片或者少量的切片(小文件放在一起统一进行切片)。

(4)开启uber模式,实现JVM重用(计算方向)
  当存在很多小文件的任务开启和结束关闭时间大于任务的执行时间时使用一个策略:将小文件的任务开启之后运行,运行完成也不结束。

  默认情况下,每个Task任务都需要启动一个JVM来运行,如果Task任务计算的数据量很小,可以让同一个Job的多个Task运行在一个JVM中,不必为每个Task都开启一个JVM。

  在没有开启uber模式下,对/input路径上上传的小文件执行wordcount程序,可用看到控制台上显示uber模式是关闭的,且http://hadoop103:8088/cluster中该任务开启的容器超过1个,不大于9个。

  开启uber模式,在mapred-site.xml中添加如下配置:

<!--  开启uber模式,默认关闭 -->
<property><name>mapreduce.job.ubertask.enable</name><value>true</value>
</property><!--uber模式中最大的mapTask数量,可向下修改  --> 
<property><name>mapreduce.job.ubertask.maxmaps</name><value>9</value>
</property>
<!--uber模式中最大的reduce数量,可向下修改 -->
<property><name>mapreduce.job.ubertask.maxreduces</name><value>1</value>
</property>
<!--uber模式中最大的输入数据量,默认使用dfs.blocksize 的值,可向下修改 -->
<property><name>mapreduce.job.ubertask.maxbytes</name><value></value>
</property>

  分发该文件,再次运行wordcount程序,观察到控制台显示uber模式开启,且http://hadoop103:8088/cluster中该任务开启的容器只有1个。

  只有一个容器的原因:开启uber模式,将小文件的任务开启之后运行,运行完成也不结束,减少开关任务的时间。

http://www.tj-hxxt.cn/news/122138.html

相关文章:

  • 搜索推广是什么意思seo推广如何做
  • 家教网站建设漯河搜狗关键词优化排名软件
  • wordpress 屏蔽国外ip长沙优化科技有限公司正规吗
  • 国内有哪些比较好的做定制旅游网站百度霸屏全网推广
  • 黄骅贴吧在线seo顾问阿亮
  • 做彩票网站需要代购深圳关键词排名seo
  • 商标注册号在哪个位置seo人工智能
  • 建设企业查询网站seo排名优化教程
  • 做app怎么做小小课堂seo自学网
  • 柳州市建设工程质量安全监督管理处网站永久免费制作网页
  • 建设执业资格注册中心网站长沙seo平台
  • 做网站赚钱 知乎免备案域名
  • 网站建设意义模板怎么做一个网站平台
  • 做代购网站如何缴税竞价推广返点开户
  • 河南 网站备案网络营销管理名词解释
  • 南通营销网站制作沈阳黄页88企业名录
  • 买了域名之后如何做网站友情链接交换工具
  • 网站建设基本流程全国疫情地区查询最新
  • 重庆网站建设aiyomseo网站推广方案
  • 免费网站制作申请2023网站推广入口
  • 导航类网站怎么做百度指数需求图谱
  • 网站架构师工资公司网络推广排名定制
  • 做物流的网站都有什么风险网页制作代码html制作一个网页
  • 武汉网页制作速成班上海网站seo快速排名
  • 手机网站设计创意说明关键词的分类和优化
  • dede网站正在维护中应该怎样设置教育培训机构加盟十大排名
  • 网站建设与网页设计总结郑州网站推广培训
  • 做跨境网站注意事项对网络营销的认识有哪些
  • 营销型网站建设的意义搜索引擎大全排行榜
  • 推广做网站怎么样今日竞彩足球最新比赛结果查询