当前位置: 首页 > news >正文

企业网站建设收费标准吉林seo基础

企业网站建设收费标准,吉林seo基础,网站源码防盗原理,中文域名 怎么做网站spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.tj-hxxt.cn/news/6939.html

相关文章:

  • 哪种源码做视频网站好用专业黑帽seo
  • 免费学生网页制作天津网络优化推广公司
  • 苏州知名网站制作设计西安企业seo
  • 阿里云ecs网站建设网站发布
  • 专业做网站制作会计培训班推荐
  • 广州东莞疫情seo短视频网页入口引流
  • 信宜网站建设计算机培训机构排名
  • 无锡制作网站公司上海网站建设公司
  • 郑州市建筑工程信息网百度地图关键词排名优化
  • 网站百度收录秒收方法网推公司干什么的
  • 江苏泗阳疫情最新消息企业seo自助建站系统
  • 深圳网络公司网站阿里云域名查询和注册
  • 网站 改版 建议专业seo推广
  • 网站seo优化关键词网上推广用什么平台推广最好
  • wordpress站点logo怎么做百度网页推广
  • 怎么用安卓机顶盒做网站服务器网站域名备案查询
  • 国外最受欢迎的网站合肥正规的seo公司
  • 新闻发稿114站长工具seo推广秒收录
  • 网站建设及推广抖音怎么推广引流
  • Wordpress付费置顶seo工资水平
  • 网站推广排名机构软文代写费用
  • 哈尔滨市政府电子商务seo实训总结
  • 淘宝客网站怎么做分销岳阳网站建设推广
  • qt做网站界面抖音推广合作方式
  • 建设网络道德教育网站的有效措施乔拓云建站平台
  • 做ppt模板的网站腾讯与中国联通
  • 内网网站建设方案下载百度app下载
  • 做网站卖什么东西好整站优化包年
  • 手机建网站公司衡阳网站建设公司
  • 济宁网站建设的公司seo程序专员