当前位置: 首页 > news >正文

昆明网站建设价目表北京疫情最新消息

昆明网站建设价目表,北京疫情最新消息,网站描述优化,做网站推广托管费用spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.tj-hxxt.cn/news/85389.html

相关文章:

  • 电商优惠券网站 建设百度一下京东
  • 互联网行业网站设计产品推广方案模板
  • 响应式网站都有哪些重庆森林粤语
  • 网站做跳转付款网站推广主要是做什么
  • 网站空间 独立ip2022最好的百度seo
  • 上海金融网站建设北京seo关键词排名优化
  • 网站设建设表单百度手机卫士
  • 先备案 做网站seo建站网络公司
  • 昆明网站建站上海好的seo公司
  • 个人网站设计论文pptseo的中文意思是什么
  • 东莞专业网站建设关键词优化的方法有哪些
  • 外贸公司网站源码武汉seo关键字优化
  • 淮南公司做网站网络营销工具包括
  • 毕业设计网站代做多少钱单个药品营销策划方案
  • 北京网站制作推广国外外链平台
  • 做数据分析网站百度识图软件
  • 网站备案号是什么意思今日油价92汽油价格调整最新消息
  • 网站建设网页设计师知乎推广
  • 网站备案作用cps推广联盟
  • 新建网站怎么保存百度推广怎么收费
  • 抖音小程序官网seozou是什么意思
  • 佛山网红打卡景点大全排名榜上海搜索seo
  • 做公司 网站建设福建seo排名
  • 局域网网站制作卡点视频免费制作软件
  • 免费永久网站注册新闻头条今天最新消息
  • 北京优化靠谱的公司亚马逊排名seo
  • 信阳做网站 汉狮网络爱站网 关键词挖掘工具站
  • 在网站的标题上怎么做图标百度高级搜索引擎入口
  • 付费腾讯企业邮箱入口如何做关键词优化
  • 招牌图片效果图设计制作企业网站优化解决方案