当前位置: 首页 > news >正文

做交易网站需要办什么证郑州航海路网站建设

做交易网站需要办什么证,郑州航海路网站建设,湖南住建云,校园门户网站开发需求分析任务描述 知识点#xff1a;安装配置Spark 重 点#xff1a; 安装配置Spark 难 点#xff1a;无 内 容#xff1a; Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop …任务描述 知识点安装配置Spark  重  点 安装配置Spark  难  点无 内  容 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架Spark拥有Hadoop MapReduce所具有的优点但不同于MapReduce的是Job中间输出结果可以保存在内存中从而不再需要读写HDFS因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 本任务主要内容是安装配置Spark并搭建Spark HA高可用架构。 任务指导 安装Spark集群主要包括以下步骤 1、下载Spark安装包在各节点中安装部署spark集群 2、配置整合 3、启动并测试 注Spark的运行方式分为三种这里使用在工作中最常用的方式 Spark on YARN将Spark托管到YARN上运行 任务实现 1. 下载Spark 可以从官方网站下载合适的版本。当前环境已经提供了安装包存放在 /opt/software目录下。 2. 在node1节点上安装Spark 解压安装Spark [rootnode1 ~]# cd /opt/software/ [rootnode1 software]# tar -xzf spark.tar.gz -C /opt/module/ 配置Spark环境变量修改系统配置文件/etc/profile。 输入【# vim /etc/profile】命令编辑/etc/profile文件增加如下内容 export SPARK_HOME/opt/module/spark/ export PATH$PATH:$SPARK_HOME/bin 使用【source  /etc/profile】命令使配置文件生效 [rootnode1 software]# source /etc/profile 进入/opt/module/spark/conf 配置文件夹 [rootnode1 software]# cd $SPARK_HOME/conf 配置spark-env.sh文件配置过程如下 使用【cp】命令从spark-env.sh.template模板文件复制并创建spark-env.sh文件 [rootnode1 conf]# cp spark-env.sh.template spark-env.sh 然后使用【 vim spark-env.sh】命令编辑该文件 [rootnode1 conf]# vim spark-env.sh 添加如下内容 export JAVA_HOME/opt/module/jdk1.8.0_301 export HADOOP_CONF_DIR/opt/module/hadoop/etc/hadoop 3. 将node1节点上的Spark分别都拷贝到node2、node3节点上 将配置好的Spark复制到其他节点对应位置上通过scp命令发送。 [rootnode1 conf]# scp -rq /opt/module/spark node2:/opt/module/ [rootnode1 conf]# scp -rq /opt/module/spark node3:/opt/module/ 将配置好的环境变量/etc/profile复制到其他节点对应位置上通过scp命令发送。 [rootnode1 conf]# scp -rq /etc/profile node2:/etc/ [rootnode1 conf]# scp -rq /etc/profile node3:/etc/ 4. Spark配置的常见问题 Spark相关命令比较灵活这里使用【 spark-shell --master yarn】进行测试代码指定将Spark托管到YARN上由于YARN调度机制的问题Spark的资源无法被正确申请所以需要修改Hadoop中的yarn-site.xml进入node1的Hadoop配置目录 [rootnode1 ~]# cd $HADOOP_HOME/etc/hadoop 使用【vim】命令修改yarn-site.xml文件 [rootnode1 hadoop]# vim yarn-site.xml 在yarn-site.xml文件的configuration标签内添加如下配置 property !--是否启动一个线程检查每个任务正使用的物理内存量如果任务超出分配值则直接将其杀掉默认是true -- nameyarn.nodemanager.pmem-check-enabled/name valuefalse/value /property property !--是否启动一个线程检查每个任务正使用的虚拟内存量如果任务超出分配值则直接将其杀掉默认是true -- nameyarn.nodemanager.vmem-check-enabled/name valuefalse/value /property 修改完成后将更新的yarn-site.xml文件分发至node2、node3的Hadoop配置文件目录中 [rootnode1 hadoop]# scp yarn-site.xml node2:/opt/module/hadoop/etc/hadoop/ [rootnode1 hadoop]# scp yarn-site.xml node3:/opt/module/hadoop/etc/hadoop/ 在node1节点上重启YARN集群 [rootnode1 hadoop]# stop-yarn.sh [rootnode1 hadoop]# start-yarn.sh 5. 测试Spark 在node1节点上首先上传一个文件至HDFS目录 [rootnode1 ~]# cd $HADOOP_HOME/ [rootnode1 hadoop]# hdfs dfs -put README.txt / 进入Spark Shell [rootnode1 hadoop]# spark-shell --master yarn 在Spark客户端执行如下代码实现对HDFS上的 README.txt 文件的内容进行词频统计即统计每个单词在文档中出现的总次数并将统计的结果保存到HDFS上的 /result目录下。 scala sc.textFile(hdfs://node1:9000/README.txt).flatMap(line line.split( )).map(word (word,1)).reduceByKey((a,b) ab).saveAsTextFile(hdfs://node1:9000/result) 输入【:quit】退出 Spark Shell scala :quit 观察HDFS的/result目录中的数据如果可以查看到词频统计的结果则说明集群运行正常 [rootnode1 hadoop]# hadoop fs -ls /result [rootnode1 hadoop]# hadoop fs -cat /result/part*
http://www.tj-hxxt.cn/news/142126.html

相关文章:

  • 中山cp网站建设wordpress 强制更新
  • 快速搭建网站前端插件深圳做网站哪家专业
  • 简单响应式网站设计代码彩票网站开发极云
  • 网站建设网页设计培训班在线做热图的网站
  • 中国建设银行网站类型网站建设技术部职责
  • 自己电脑怎么做网站福州外贸网站制作
  • 南沙网站开发电子工程师兼职平台
  • 太原正规的网站制作深圳知名网站建设公司
  • wordpress 显示文章应用商店aso优化
  • 珠海建网站专业公司重庆云虚拟主机
  • 电商网站建设实训(互联网营销大赛)wordpress 修改文字
  • 韩国食品网站设计欣赏山东裕达建设工程咨询有限公司网站
  • 电商网站商品页的优化目标是什么国际域名和国内域名区别
  • 网站建站网站多少钱备案网站还是域名
  • 企业网站分为哪三种类型wordpress注册上面的logo
  • 河北省建设网站锁安装什么驱动logo设计免费生成器在线
  • 网站维护和推广wordpress 导航链接
  • 做阿里巴巴网站多少钱微信网站开发需要什么技术
  • 怎么查网站死链免费申请靓号
  • 淄博网站建设有限公司rp如何做网站
  • 网站智能建设有那些优势自建wordpress
  • 银川建设网站公司学ui设计难不难
  • 网站建设教程自学网设计网站的公司名称
  • 做网站项目前怎么收集需求wordpress评论关闭
  • 精利手表网站合肥建设干部学校网站首页
  • 网站创意策划方案做做做做网站
  • 如何用织梦搭建网站浙江网站建设平台
  • 广州青菜篮农业有限公司网站建设项目给网站可以怎么做外链
  • 做外贸选取哪个网站iframe 一直网站底部
  • 公司网站开发与维护高清有线电视沈阳