当前位置: 首页 > news >正文

商务网站建设与规划百度统计app

商务网站建设与规划,百度统计app,3d动画制作自学教程,男女做的羞羞事的网站Photon Hash Aggregation Vectorization Photon Hash Join 的向量化的要点是:使用开放地址法。步骤: 向量化计算 hash 值基于 hash 向量化计算 bucket 下标,得到 bucket index 向量基于 bucket index 向量中记录的下标找到 bucket&#xff…

Photon Hash Aggregation Vectorization

Photon Hash Join 的向量化的要点是:使用开放地址法。步骤:

  1. 向量化计算 hash 值
  2. 基于 hash 向量化计算 bucket 下标,得到 bucket index 向量
  3. 基于 bucket index 向量中记录的下标找到 bucket,判定是否冲突,如果冲突则继续向下,直至找到正确 bucket,将正确 bucket 下标回填到 bucket index 向量中 (Not So Vectorized)。下图中绿色就是解决冲突后找到的 bucket 位置。

在这里插入图片描述
4. 向量化计算 Aggregate 值。伪代码如下:
在这里插入图片描述
可以看到,上面几个步骤里,除了 3 里面有一些不规整的操作,其余都是非常简单的 kernel 操作。

Photon 关于 Null 的考虑

Photon 测试发现,为了处理 Null,会付出 23+% 的开销。基于如下观察:

  • 用户很少专门给列加上 Not Null 约束
  • 很多场景里虽然没有指明 Not Null 约束,但实际数据中 Null 很少

所以,Photo 给每一个 batch 的数据都附带了一个 has_nulls() 标记,如果这一批数据里面一个 null 都没有,那么这一批数据的计算就可以使用 NotNullKernel,性能最佳;反之,就回退到使用 WithNullKernel,付出必要的代价。

在这里插入图片描述
注意:这里要强调 Batch,而不是全量数据。全量数据里有少许 Null,但其中大部分 Batch 里没有 Null,就能用上上述优化。

Photon 关于 Selector / Active Rows 考虑

考虑到存在 Filter,并且 Filter 可能会过滤掉大部分数据,Photon 为过滤后的数据创建了一个 Active Rows 结构,用于索引未被过滤的数据。
增加 Active Rows 概念后,后继所有数据访问都要通过 Active Rows 索引来定位,成为框架固有开销。

另一种实现思路是引入 Skip 数组,当行过滤时,Skip[i] 被设置为 1,否则为 0。访问过滤后的数据时,需要遍历整个 skip 数组。这么做的好处是(…内存好管理?),缺点是增加了不必要的判断。

http://www.tj-hxxt.cn/news/114366.html

相关文章:

  • 网站开发网站页面2022年度最火关键词
  • 在线做章网站免费域名 网站
  • 网站里网格怎么做深圳整合营销
  • 东阿企业做网站推广海南百度总代理
  • 自己可以做开奖网站吗河北seo基础知识
  • flash型网站网址优化网站平台
  • 珠海市工程造价信息网seo排名影响因素主要有
  • 什么叫网站建设方案书做好网络推广的技巧
  • 哪个网站卖做阳具好点汽车营销策划方案ppt
  • 灵宝网站制作工作室制作链接的小程序
  • 做网站+广告费+步骤百度贴吧网页版入口
  • 做交友网站需要什么免费发帖论坛大全
  • 网站搭建原则html网页制作用什么软件
  • 优秀flash网站设计个人怎么在百度上做推广
  • 网站建设论文 php网络推广费用
  • 宁夏网站建设百度seo快速排名优化服务
  • 主做销售招聘的招聘网站有哪些seo顾问是干什么
  • 自学网站开发多少时间国外seo大神
  • 现在的那家做网站比较好一些呢最近最新的新闻
  • 知识付费网站搭建教程百度关键词优化大师
  • 东营市两学一做考试网站新闻软文怎么写
  • 苏州哪家做网站友情链接的作用有哪些
  • 业务代刷平台网站怎么做网络推广有哪些
  • 3g网站制作成都网站快速排名提升
  • 怎么样建设网站山西seo和网络推广
  • 网络营销的概念?seo网站有优化培训班吗
  • 产品网站推广方案百度排名优化专家
  • 南昌网站建设模板文档网站备案查询系统
  • 赤峰做企业网站公司扬州网络优化推广
  • 手机购物网站模板周口seo