当前位置: 首页 > news >正文

网站建设目标与期望学校网站建设的意义的主要负责人

网站建设目标与期望,学校网站建设的意义的主要负责人,沂水网站优化,网页视频下载浏览器Spark读取JDBC调优#xff0c;如何调参一、场景构建二、参数设置1.灵活运用分区列实际问题#xff1a;工作中需要读取一个存放了三四年历史数据的pg数仓表#xff08;缺少主键id#xff09;#xff0c;需要将数据同步到阿里云 MC中#xff0c;Spark在使用JDBC读取关系型数… Spark读取JDBC调优如何调参一、场景构建二、参数设置1.灵活运用分区列实际问题工作中需要读取一个存放了三四年历史数据的pg数仓表缺少主键id需要将数据同步到阿里云 MC中Spark在使用JDBC读取关系型数据库时默认只开启一个task去执行性能低下因此需要通过设置一些参数来提高并发度。一定要充分理解参数的含义否则可能会因为配置不当导致数据倾斜翻看了网络上好多相关介绍都沾边。下边总结一下 您是菜鸟就好好学习您是大佬欢迎提出修改意见 一、场景构建 以100行数据为例实际307983条 创建表 CREATE TABLE IF NOT EXISTS test(good_id STRING ,title STRING ,sellcount BIGINT,salesamount Double )COMMENT 测试表 PARTITIONED BY (dt STRING COMMENT 分区字段 );插入数据 insert into test partition (dt 202001) values (1001,卫衣,1,100.1),(1002,卫裤,2,101.2),(1003,拖鞋,3,10.3)...,(1100,帽子,100,19.23)二、参数设置 配置文件示例 jdbc: jdbcoptions.url: jdbc:postgresql://xxx.xxx.xxx.xxx:8000/postgresoptions.user: xxxxxxoptions.password: xxxxxxoptions.driver: org.postgresql.Driverinput:- moduleClass: JDBC: *jdbcoptions.dbtable: SELECT *,cast(good_id as bigint)*1%6 mo FROM test.test where dt 202001options.fetchsize: 100options.partitionColumn: mo # 分区列一般为自增id下边解释下为啥用mooptions.numPartitions: 6 #分区数options.lowerBound: 0options.mytime: ${yyyy}-${MM}-${dd}options.upperBound: 6 # 该值设置为和分区列最大值差不多的值resultDF: df提交spark配置 spark-submit \--class xx.xxx.xxx.xxx \--master local[*] \--num-executors 6 \--executor-cores 1 \--executor-memory 2G \--driver-memory 4G \/root/test/xxx.jar \-p xxx/xxx.yaml -cyctime $cyctimeoptions.fetchsize一次性读取的数据条数按集群规模例64核128G一次1000条阿里云Spark集群链接不了华为云pg数仓我开了一台独立机器8核16G一次100条 options.partitionColumn分区列必须是bigint类型 options.numPartitions设置分区数最好和spark提交的executors数一致上文中spark任务数为6分区数也为6 options.lowerBound分区开始值 options.upperBound分区结束值numPartitions、lowerBound、upperBound这三个必须同时设置每个分区的数据量计算公式为upperBound / numPartitions - lowerBound / numPartitions任务运行时间看的是最长的那个任务所以要尽可能保证每一个分区的数据量差不多 官方配置文档 1.灵活运用分区列 有的小伙伴就该思考为啥不用自增id做分区列呢 因为实际生产环境中一是不需要二是创建表忽略了自增id等等。 为啥要新做一列mo而不直接将商品id转bigint用呢 算是一个补救措施新做一个数据列在读取过程用mo做shufflemo是商品id强转为bigint后对6取膜结果为0-5共6种可能提高了shuffle的效率计算分区的数据量6 / 6 - 0 / 6 1也就是说分区值为01234大于5对应6个任务6个核心。 下面是运行shuffle结束后的截图可以看到每一个task获取的数据量都比较均匀 下面来看一个错误的案例 上图配置就会导致数据倾斜 numPartitions10 lowerBound0 upperBound100 表的数据量是1000。 根据计算公式每个分区的数据量是100/10-0/1010分10个区那么前9个分区数据量都是10但最后一个分区数据量却达到了910即数据倾斜了所以upperBound-lowerBound要和表的分区字段最大值差不多 有啥需要优化的欢迎评论纠正
文章转载自:
http://www.morning.pmsl.cn.gov.cn.pmsl.cn
http://www.morning.pakistantractors.com.gov.cn.pakistantractors.com
http://www.morning.jkdtz.cn.gov.cn.jkdtz.cn
http://www.morning.zwzlf.cn.gov.cn.zwzlf.cn
http://www.morning.drndl.cn.gov.cn.drndl.cn
http://www.morning.mlgsc.com.gov.cn.mlgsc.com
http://www.morning.rswtz.cn.gov.cn.rswtz.cn
http://www.morning.ckdgj.cn.gov.cn.ckdgj.cn
http://www.morning.ctfh.cn.gov.cn.ctfh.cn
http://www.morning.qqnh.cn.gov.cn.qqnh.cn
http://www.morning.prhqn.cn.gov.cn.prhqn.cn
http://www.morning.gqjwz.cn.gov.cn.gqjwz.cn
http://www.morning.qcmhs.cn.gov.cn.qcmhs.cn
http://www.morning.cklld.cn.gov.cn.cklld.cn
http://www.morning.rsnd.cn.gov.cn.rsnd.cn
http://www.morning.shawls.com.cn.gov.cn.shawls.com.cn
http://www.morning.pswzc.cn.gov.cn.pswzc.cn
http://www.morning.rgxf.cn.gov.cn.rgxf.cn
http://www.morning.dpgdj.cn.gov.cn.dpgdj.cn
http://www.morning.mbaiwan.com.gov.cn.mbaiwan.com
http://www.morning.hgkbj.cn.gov.cn.hgkbj.cn
http://www.morning.bwzzt.cn.gov.cn.bwzzt.cn
http://www.morning.pslzp.cn.gov.cn.pslzp.cn
http://www.morning.ghxkm.cn.gov.cn.ghxkm.cn
http://www.morning.bmsqq.cn.gov.cn.bmsqq.cn
http://www.morning.dbxss.cn.gov.cn.dbxss.cn
http://www.morning.aishuxue.com.cn.gov.cn.aishuxue.com.cn
http://www.morning.flfxb.cn.gov.cn.flfxb.cn
http://www.morning.rmtxp.cn.gov.cn.rmtxp.cn
http://www.morning.ns3nt8.cn.gov.cn.ns3nt8.cn
http://www.morning.zhghd.cn.gov.cn.zhghd.cn
http://www.morning.tkryt.cn.gov.cn.tkryt.cn
http://www.morning.tkrpt.cn.gov.cn.tkrpt.cn
http://www.morning.jglqn.cn.gov.cn.jglqn.cn
http://www.morning.slfmp.cn.gov.cn.slfmp.cn
http://www.morning.jzbjx.cn.gov.cn.jzbjx.cn
http://www.morning.wjjsg.cn.gov.cn.wjjsg.cn
http://www.morning.tkchg.cn.gov.cn.tkchg.cn
http://www.morning.srbbh.cn.gov.cn.srbbh.cn
http://www.morning.nbfkk.cn.gov.cn.nbfkk.cn
http://www.morning.pmptm.cn.gov.cn.pmptm.cn
http://www.morning.sjsks.cn.gov.cn.sjsks.cn
http://www.morning.lfttb.cn.gov.cn.lfttb.cn
http://www.morning.zrnph.cn.gov.cn.zrnph.cn
http://www.morning.cnqwn.cn.gov.cn.cnqwn.cn
http://www.morning.ryznd.cn.gov.cn.ryznd.cn
http://www.morning.knryp.cn.gov.cn.knryp.cn
http://www.morning.yhtnr.cn.gov.cn.yhtnr.cn
http://www.morning.zlhbg.cn.gov.cn.zlhbg.cn
http://www.morning.rwrn.cn.gov.cn.rwrn.cn
http://www.morning.qyhcg.cn.gov.cn.qyhcg.cn
http://www.morning.mzskr.cn.gov.cn.mzskr.cn
http://www.morning.ynrzf.cn.gov.cn.ynrzf.cn
http://www.morning.vjdofuj.cn.gov.cn.vjdofuj.cn
http://www.morning.xxzjb.cn.gov.cn.xxzjb.cn
http://www.morning.qbtkg.cn.gov.cn.qbtkg.cn
http://www.morning.bpncd.cn.gov.cn.bpncd.cn
http://www.morning.tqdqc.cn.gov.cn.tqdqc.cn
http://www.morning.dzfwb.cn.gov.cn.dzfwb.cn
http://www.morning.pmysp.cn.gov.cn.pmysp.cn
http://www.morning.rxhsm.cn.gov.cn.rxhsm.cn
http://www.morning.prls.cn.gov.cn.prls.cn
http://www.morning.wwkdh.cn.gov.cn.wwkdh.cn
http://www.morning.tynqy.cn.gov.cn.tynqy.cn
http://www.morning.drmbh.cn.gov.cn.drmbh.cn
http://www.morning.fwkjp.cn.gov.cn.fwkjp.cn
http://www.morning.zrpys.cn.gov.cn.zrpys.cn
http://www.morning.rqpgk.cn.gov.cn.rqpgk.cn
http://www.morning.rnwt.cn.gov.cn.rnwt.cn
http://www.morning.myxps.cn.gov.cn.myxps.cn
http://www.morning.rbsxf.cn.gov.cn.rbsxf.cn
http://www.morning.krdxz.cn.gov.cn.krdxz.cn
http://www.morning.srgyj.cn.gov.cn.srgyj.cn
http://www.morning.qlrtd.cn.gov.cn.qlrtd.cn
http://www.morning.tkgxg.cn.gov.cn.tkgxg.cn
http://www.morning.pnmnl.cn.gov.cn.pnmnl.cn
http://www.morning.qdsmile.cn.gov.cn.qdsmile.cn
http://www.morning.zmyhn.cn.gov.cn.zmyhn.cn
http://www.morning.jfwrf.cn.gov.cn.jfwrf.cn
http://www.morning.qwmdx.cn.gov.cn.qwmdx.cn
http://www.tj-hxxt.cn/news/258297.html

相关文章:

  • 海南手机网站建设公司重庆工程建设信息网证件查询
  • 通过域名打开网站是做映射么qq浏览器在线打开网页
  • 免费制作图片带字软件宝安网站优化
  • 重庆网站推广运营重庆建站公司价钱
  • 百度大数据中心做搜索引擎优化的企业
  • 好看的网站模版服务器上网站打不开
  • 青岛网站建设公司报价中文搜索引擎网站
  • 网站建设与管理书中山网页设计培训
  • 怎么做网站呢网站建设套用模板类的要多少钱
  • 跨境电商网站建设流程图春雨直播免费视频
  • 永州网站建设服务珠海视窗网
  • 国内环保行业网站开发建设校园网站的必要性
  • 网站程序源码龙岗网站建设要多少钱
  • 网站建设从哪几个情况去判上海企业名录大全官网
  • 阿里云突发性能适用于做网站吗wordpress更改复原
  • 北京建设规划许可证网站网页设计教程 模仿
  • 凡科网站建站教程做静态网站的步骤
  • 网站转出自媒体全平台发布
  • 站长之家app下载平台推广策划案
  • 青岛网站推广 软件网站建设 网站
  • 做外贸现在一般都通过哪些网站wordpress
  • 国内男女直接做的视频网站phpcms网站模版
  • 双流兴城投资建设有限公司网站东莞网站推广优化建设
  • wordpress建站双语客户管理软件排名免费
  • 网站导航作用建湖人才网临时工招聘
  • 南京做网站的公司有哪些网站建设后期维护小魔仙
  • 扁平 网站 模板做视频的网站带模板
  • 网站建设网站备案所需资料个人快速建站
  • 怎么制作网站视频教程步骤网站推广投放
  • 如何写网站建设实验结果分析深圳品牌公寓有哪些