当前位置: 首页 > news >正文

微信网站设计运营武汉百度推广外包

微信网站设计运营,武汉百度推广外包,微信报名小程序怎么做,wordpress图片 高清当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖。 当分区由少变多时,是需要shuffle的。 但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系&…

当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖

当分区由少变多时,是需要shuffle的。

但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系,他们同处在一个Stage中,就可能造成spark程序的并行度不够,从而影响性能,如果1000个分区变成1个分区,为了使coalesce之前的操作有更好的并行度,可以将shuffle设置为true。

scala> val arr = Array(1,2,3,4,5,6,7,8,9)
arr: Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9)scala> sc.makeRDD(arr,3)
res12: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[14] at makeRDD at <console>:27scala> res12.coalesce(2)
res13: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[15] at coalesce at <console>:26scala> res13.partitions.size 
res14: Int = 2scala> res12.coalesce(12)
res15: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[16] at coalesce at <console>:26scala> res15.partitions.size
res16: Int = 3scala> res12.repartition(2)
res17: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[20] at repartition at <console>:26scala> res17.partitions.size
res18: Int = 2scala> res12.repartition(12)
res19: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[24] at repartition at <console>:26scala> res19.partitions.size
res20: Int = 12

repartition算子底层调用的是coalesce算子。且shuffle指定了值为true。一定会发生shuffle阶段。

repartition带有shuffle可以增加也可以减少。shuffle参数指定为true,即一定会发生shuffle阶段。

coalesce算子只能减少不能增加。由于coalesce的shuffle默认false。

例子:

如果说一个阶段中存在union或者是coalesce算子会出现rdd的分区数量变化,但是没有shuffle的情况,看最后的rdd的分区个数就是当前阶段的task任务的个数

coalesce算子并没有发生shuffle,没有划分stage。但reduceByKey产生了shuffle,所以应该划分stage。

http://www.tj-hxxt.cn/news/6424.html

相关文章:

  • 做引流去那些网站好百度站长工具排名
  • 网站开发工具安卓版中国第一营销网
  • app外包平台大概多少钱基本seo
  • 山西招标网seo新人怎么发外链
  • 网站开发流程java专业的google推广公司
  • 怎么快速建一个网站公众号软文怎么写
  • 地方网站运营方案百度seo排名优化技巧分享
  • 容桂网站制作值得信赖seo技术教程博客
  • 做装修网站卖钱百度应用app
  • 如何撤销网站备案赣州网站建设公司
  • 网页制作手机软件洛阳seo网站
  • 国外做的比较的ppt网站有哪些方面精品成品网站源码
  • 哪个网站可以做中国代购全国广告投放平台
  • 北京移动网站建设百度收录规则2022
  • 如何建设诗词网站最新新闻热点话题
  • 电子商务基础网站建设今天微博热搜前十名
  • 卧龙区网站建设百度客服人工电话
  • 深圳做网站的爱情独白广州新闻最新消息今天
  • 做教育app的网站有哪些内容seo技术公司
  • 用easyui做的网站百度关键词热度排名
  • 私人让做彩票网站吗seo网站关键词优化方法
  • 皇马logo做网站做网站需要准备什么
  • 秦皇岛政府网站官网网站被禁用如何解决
  • 广州海珠区最新疫情济宁seo公司
  • 商务网站创建方案网站优化推广招聘
  • 用html做卖珠宝的网站公司网站免费建站
  • 福州如何做百度的网站百度推广app下载官方
  • 做职业规划的网站郑州关键词排名顾问
  • 湛江专业建站推广机构营销宣传图片
  • 家装公司需要装修资质吗杭州seo培训