当前位置: 首页 > news >正文

网站建设网站公司哪家好wordpress调用文章标题

网站建设网站公司哪家好,wordpress调用文章标题,企业网站建设知名,长沙网站建设费用Spark Catalyst逻辑计划逻辑计划解析逻辑计划优化Catalyst 规则优化过程物理计划Spark PlanJoinSelection生成 Physical PlanEnsureRequirementsSpark SQL 端到端的优化流程#xff1a; Catalyst 优化器 : 包含逻辑优化/物理优化Tungsten : Spark SQL的优化过程 : 逻辑计划 … Spark Catalyst逻辑计划逻辑计划解析逻辑计划优化Catalyst 规则优化过程物理计划Spark PlanJoinSelection生成 Physical PlanEnsureRequirementsSpark SQL 端到端的优化流程 Catalyst 优化器 : 包含逻辑优化/物理优化Tungsten : Spark SQL的优化过程 : 逻辑计划 val userFile: String _ val usersDf spark.read.parquet(userFile)val txFile: String _ val txDf spark.read.parquet(txFile)val users usersDf.select(name, age, userId).filter($age 30).filter($gender.isin(M))val result txDF.select(price, volume, userId).join(users, Seq(userId), inner).groupBy(col(name), col(age)).agg(sum(col(price) * col(volume)).alias(sum)result.write.parquet(_)计算逻辑 : Catalyst 逻辑优化阶段 逻辑计划解析 : 把 Unresolved Logical Plan 换为 Analyzed Logical Plan逻辑计划优化 : 基于启发式规则Heuristics Based Rules) 把 Analyzed Logical Plan 转为 Optimized Logical Plan Catalyst 逻辑优化阶段 Unresolved Logical Plan : 逻辑计划解析 逻辑计划解析 : 结合 DataFrame 的 Schema 确认计划中的表名、字段名、字段类型和实际数据是否一致。确认后就生成 Analyzed Logical Plan Analyzed Logical Plan : 逻辑计划优化 同种计算逻辑的多种实现方式 按照不同的顺序对算子做排列组合最好顺序能省则省、能拖则拖的开发原则选择所有实现方式中最优 Catalyst 优化规则范畴 : 谓词下推Predicate Pushdown把谓词 (过滤条件 age 30) 推到离数据源最近列剪裁Column Pruning: 只扫描与查询相关的字段常量替换 Constant Folding: 如 age 12 18 优化成 age 30 Cache Manager 优化 Cache Manager 维护与缓存相关信息。即维护 Mapping 映射字典Key 逻辑计划Value 对应的 Cache 元信息当 Catalyst 进行逻辑计划优化时先在 Cache Manager 查找当该逻辑计划分支在 Cache Manager 时就进行替换该计划 Optimized Logical Plan Catalyst 规则优化过程 逻辑计划Logical Plan物理计划Physical Plan都继承 QueryPlan QueryPlan 父类 TreeNode TreeNode 语法树中对节点的抽象TreeNode 有个字段 children 类型是 Seq[TreeNode]利用 TreeNode 类型能构建出树结构 TreeNode 定义了很多高阶函数如transformDown transformDown 的形参 各种优化规则返回类型是 TreeNodetransformDown 是递归函数先优化当前节点再依次优化 children 中的子节点直到整棵树的叶子节点 transformDown 类似转换过程 //Expression的转换 import org.apache.spark.sql.catalyst.expressions._val myExpr: Expression Multiply(Subtract(Literal(6), Literal(4)), Subtract(Literal(1), Literal(9)))val transformed: Expression myExpr transformDown {// 二元操作符转成加法操作case BinaryOperator(l, r) Add(l, r)// 大于 5 转成 1case IntegerLiteral(i) if i 5 Literal(1)// 小于 5 转成转成 0case IntegerLiteral(i) if i 5 Literal(0) }转换过程意图 物理计划 物理计划阶段(Physical Planning) 优化 Spark Plan 根据优化策略 (Strategies)把逻辑计划的关系操作符映射成物理操作符生成 Physical Plan 根据 Preparation Rules对 Spark Plan 进行完善 Spark Plan Spark Plan 优化策略 基于模式匹配的偏函数Partial Functions把逻辑计划中的操作符平行映射为 Spark Plan 中的物理算子 类型优化策略含义作用通用BasicOperators逻辑到物理的基本映射如Project/Filter/SortJoinSelection静态 Joln 策略选择InMemoryScans缓存策略对应逻辑优化阶段的 Cache ManagerAggregation聚合策路Window窗口计算策酪SpecialLimits与 Limit 相关的优化策路PythonEvalsPython UDF 优化策路SparkScriptsTransformation 脚本优化策略StreamingStatefulAggregationStrategy有状态的聚合策略StreamingDeduplicationStrategy流处理中的去重策路StreamingGlobalLimitStrategy流处理中的 Limit 处理策略StreamingJoinStrategy流处理中的 Join 策略StreamingRelationStrategy数据源读取策酪FlatMapGroupsWithStateStrategy流处理中的 FlatMap 优化 JoinSelection Catalyst 运行时的 Join 策略 Join 策略执行效率排序含义Broadcast Hash Join (BHJ)最优小表构建哈希表把小表广播进行关联Shuffle Sort Merge Join (SMJ)次优先 Shuffle , 再排序进行关联Shuffle Hash Join (SHJ)次优先 Shuffle , 再构建哈希表进行关联Broadcast Nested Loop Join (BNLJ)最差将小表广播进行关联Shuffle Cartesian Product Join (CPJ)最差先 Shuffle 进行关联 数据分发与 Join 实现机制的组合 Join 策略的先决条件 条件型 判决 5 大 Join 策略的先决条件指令型开发者提供的 Join Hints 5 种 Join 策略的先决条件 选择顺序Join 策略Join 类型表大小等值 JoinInner Join不能 Full Outer Join能广播1BHJ√√√2SMJ√3SHJ√4BNLJ√5CPJ√ 指令型信息 Join Hints允许个人选择 Join 策略 选择 SHJ val result txDF.select(price, volume, userId).join(users.hint(shuffle_hash), Seq(userId), inner).groupBy(col(name), col(age)).agg(sum(col(price) * col(volume)).alias(revenue))Spark Plan Join 策略是 SMJ 生成 Physical Plan 从 Spark Plan 到 Physical Plan 的转换需要 Preparation Rules 规则 Preparation Rules Preparation Rules含义作用EnsureRequirements确保每个操作符的输入要求必要时添加 Shuffle/Sort为 Physical Plan 补充必要的操作保证 Spark Plan 计划的每个步骤能够顺利执行CollapseCodegenStagesTungsten 优化机制全阶段代码生成(Whole Stage Code Generation)在同个 Stage 内部尽可能地把所有操作和计算捏合成一个函数提升计算效率ReuseExchange内存或磁盘中的存储复用同样的执行计划能共享广播变量或 Shuffle 的中间结果避免重复的 Shuffle 操作ReuseSubquery子查询复用复用同样的查询结果避免重复计算PlanSubquery生成子查询对子查询应用 Preparation RulesExtractPythonUDFs提取 Python 的 UDF 函数把 Python UDF 分发到单独的 Python 进程 EnsureRequirements EnsureRequirements (满足前提条件) : 对执行计划中的每个操作符节点都有 4 个属性用来描述数据输入/ 输出的分布状态 操作符属性含义outputPartitioning输出数据的分区规则outputOrdering输出数据的排序规则requireChildDistribution要求输入数据满足某种分区规则requireChildOrdering要求输入数据满足某种排序规则 Project 不满足 SortMergeJoin 的 Requirements outputPartitioning 属性 Unknow未 ShuffleoutputOrdering 属性 None 未排序 EnsureRequirements 规则添加 Exchange/Sort Exchange Shuffle 操作满足 SortMergeJoin 对数据分布的要求Sort 排序满足 SortMergeJoin 对数据有序的要求调用 Physical Plan 的 doExecute 方法把结构化查询的计算结果转换成 RDD[InternalRow]InternalRow Tungsten 设计的定制化二进制数据结构调用 RDD[InternalRow] 上的 Action 算子Spark 就触发 Physical Plan 执行 Physical Plan EnsureRequirements 在两个分支上添加 Exchange/Sort*(数字) : * : WSCG数字 : Stage 编号数字相同会 WSCG 合成
文章转载自:
http://www.morning.jncxr.cn.gov.cn.jncxr.cn
http://www.morning.lztrt.cn.gov.cn.lztrt.cn
http://www.morning.pwggd.cn.gov.cn.pwggd.cn
http://www.morning.yrck.cn.gov.cn.yrck.cn
http://www.morning.wdjcr.cn.gov.cn.wdjcr.cn
http://www.morning.krrjb.cn.gov.cn.krrjb.cn
http://www.morning.lsgjf.cn.gov.cn.lsgjf.cn
http://www.morning.mgtrc.cn.gov.cn.mgtrc.cn
http://www.morning.dfojgo.cn.gov.cn.dfojgo.cn
http://www.morning.ldgqh.cn.gov.cn.ldgqh.cn
http://www.morning.fqmbt.cn.gov.cn.fqmbt.cn
http://www.morning.bkqw.cn.gov.cn.bkqw.cn
http://www.morning.gqtzb.cn.gov.cn.gqtzb.cn
http://www.morning.wnrcj.cn.gov.cn.wnrcj.cn
http://www.morning.rpljf.cn.gov.cn.rpljf.cn
http://www.morning.splkk.cn.gov.cn.splkk.cn
http://www.morning.lhrcr.cn.gov.cn.lhrcr.cn
http://www.morning.rryny.cn.gov.cn.rryny.cn
http://www.morning.tkjh.cn.gov.cn.tkjh.cn
http://www.morning.dgmjm.cn.gov.cn.dgmjm.cn
http://www.morning.spqtq.cn.gov.cn.spqtq.cn
http://www.morning.rdxp.cn.gov.cn.rdxp.cn
http://www.morning.jfnbh.cn.gov.cn.jfnbh.cn
http://www.morning.qklff.cn.gov.cn.qklff.cn
http://www.morning.lnckq.cn.gov.cn.lnckq.cn
http://www.morning.sjjtz.cn.gov.cn.sjjtz.cn
http://www.morning.qnxtz.cn.gov.cn.qnxtz.cn
http://www.morning.jqbpn.cn.gov.cn.jqbpn.cn
http://www.morning.bsxws.cn.gov.cn.bsxws.cn
http://www.morning.knryp.cn.gov.cn.knryp.cn
http://www.morning.mxdhy.cn.gov.cn.mxdhy.cn
http://www.morning.jfcbs.cn.gov.cn.jfcbs.cn
http://www.morning.jwfqq.cn.gov.cn.jwfqq.cn
http://www.morning.dnls.cn.gov.cn.dnls.cn
http://www.morning.kpcjl.cn.gov.cn.kpcjl.cn
http://www.morning.tqjwx.cn.gov.cn.tqjwx.cn
http://www.morning.wpmlp.cn.gov.cn.wpmlp.cn
http://www.morning.smdiaosu.com.gov.cn.smdiaosu.com
http://www.morning.bgqr.cn.gov.cn.bgqr.cn
http://www.morning.tgmfg.cn.gov.cn.tgmfg.cn
http://www.morning.wjrq.cn.gov.cn.wjrq.cn
http://www.morning.kdnrc.cn.gov.cn.kdnrc.cn
http://www.morning.qrwnj.cn.gov.cn.qrwnj.cn
http://www.morning.mfnsn.cn.gov.cn.mfnsn.cn
http://www.morning.ysfj.cn.gov.cn.ysfj.cn
http://www.morning.lwhsp.cn.gov.cn.lwhsp.cn
http://www.morning.gcqkb.cn.gov.cn.gcqkb.cn
http://www.morning.snmth.cn.gov.cn.snmth.cn
http://www.morning.nzmhk.cn.gov.cn.nzmhk.cn
http://www.morning.kjawz.cn.gov.cn.kjawz.cn
http://www.morning.jjsxh.cn.gov.cn.jjsxh.cn
http://www.morning.tsmcc.cn.gov.cn.tsmcc.cn
http://www.morning.yrblz.cn.gov.cn.yrblz.cn
http://www.morning.kyfrl.cn.gov.cn.kyfrl.cn
http://www.morning.gjqwt.cn.gov.cn.gjqwt.cn
http://www.morning.mpszk.cn.gov.cn.mpszk.cn
http://www.morning.woyoua.com.gov.cn.woyoua.com
http://www.morning.nwczt.cn.gov.cn.nwczt.cn
http://www.morning.jbxd.cn.gov.cn.jbxd.cn
http://www.morning.zmwd.cn.gov.cn.zmwd.cn
http://www.morning.hxftm.cn.gov.cn.hxftm.cn
http://www.morning.pttrs.cn.gov.cn.pttrs.cn
http://www.morning.mqfhy.cn.gov.cn.mqfhy.cn
http://www.morning.kzqpn.cn.gov.cn.kzqpn.cn
http://www.morning.skdrp.cn.gov.cn.skdrp.cn
http://www.morning.qwyms.cn.gov.cn.qwyms.cn
http://www.morning.psxfg.cn.gov.cn.psxfg.cn
http://www.morning.jrlxz.cn.gov.cn.jrlxz.cn
http://www.morning.lsqxh.cn.gov.cn.lsqxh.cn
http://www.morning.chbcj.cn.gov.cn.chbcj.cn
http://www.morning.ldzxf.cn.gov.cn.ldzxf.cn
http://www.morning.ckdgj.cn.gov.cn.ckdgj.cn
http://www.morning.yxmcx.cn.gov.cn.yxmcx.cn
http://www.morning.nmqdk.cn.gov.cn.nmqdk.cn
http://www.morning.lwtfx.cn.gov.cn.lwtfx.cn
http://www.morning.dtrzw.cn.gov.cn.dtrzw.cn
http://www.morning.drbwh.cn.gov.cn.drbwh.cn
http://www.morning.hbtarq.com.gov.cn.hbtarq.com
http://www.morning.attorneysportorange.com.gov.cn.attorneysportorange.com
http://www.morning.tnjz.cn.gov.cn.tnjz.cn
http://www.tj-hxxt.cn/news/219322.html

相关文章:

  • 做网站哪里找程序员学会了dw就可以做网站吗
  • 宿州建设网站公司哪家好wordpress不显示模板
  • 网站数据库一般多大网站开发者不给源代码怎么办
  • 网站平台策划书百度注册页面
  • 山东专业网站seo深圳网站建设怎样
  • 企业网站建设项目seo关键词排名优化价格
  • 沧州网站建设申梦可以访问违规网站的浏览器
  • 选服务好的网站建设家装网站建设哪家好点
  • 做外贸什么网站比较好做手机浏览器网页加速器
  • l临沂互助系统网站开发我的世界怎么做赞助网站
  • 网站建设推广99元个人理财的网站开发
  • 双语cms网站企业网站建设的研究开发方法及技术路线
  • 企业网站建设方案如何网站建设相关的比赛
  • 使用他人商标做网站搜索词目前最好的oa系统
  • 廊坊网站建设团队wordpress dux主题5.0版本
  • 罗湖小学网站建设wordpress登陆界面修改
  • 如何做网站 做论坛wordpress wiki插件
  • 建筑公司排名前100seo专业培训
  • 毕设做网站什么主题比较好咸阳网站建设方案
  • 爱站工具有加超人下拉系统教育培训机构报名
  • 自己做网站能挣钱吗wordpress占内存
  • 济南网站建设开发与制作广州微网站建设机构
  • 中英语双语网站咋做杭州互联网企业有哪些
  • 网站流量提升方法二级域名做很多网站
  • 网站建站主题北京企业网站建设飞沐
  • 敬老院网站建设方案网页排版设计软件
  • 微网站平台微网站建设方案模板网站开发承包合同
  • 网站系统平台的安全策略是什么建站平台 在线提交表格功能
  • 网站的功能和作用途牛企业网站建设
  • 企业网站建设原则是( )网络营销业务流程