当前位置: 首页 > news >正文

seo百度贴吧优化防疫措施

seo百度贴吧,优化防疫措施,周村网站制作哪家好,网络规划设计师专项提升1.存储格式 textfile、sequencefile、orc、parquet sequencefile很少使用(不介绍了),常见的主要就是orc 和 parquet 建表声明语句是:stored as textfile/orc/parquet行存储:同一条数据的不同字段都在相邻位置&#xff…

1.存储格式

textfile、sequencefile、orc、parquet
sequencefile很少使用(不介绍了),常见的主要就是orc 和
parquet

建表声明语句是:stored as textfile/orc/parquet

行存储:同一条数据的不同字段都在相邻位置,所以当要查找某一条记录所有数据时行存储查询速度比较快
列存储:以列来聚集数据,相同字段的值聚集在一起,所以当查询某一个指定列的所有数据时,列存储查询速度比较快

  1. Textfile

行式存储,这是hive表的默认存储格式,默认不做数据压缩,方便查看和编辑,占用空间大,I/O性能低,磁盘开销大,数据解析开销大,数据不支持分片(即代表着会带来无法对数据进行并行操作)。

  1. Orc

行列式存储,将数据按行分块,每个块按列存储,其中每个块都存储着一个索引,支持none和zlib和snappy这3种压缩方式,默认采用zlib压缩方式,不支持切片,orc存储格式能提高hive表的读取写入和处理的性能。

  1. Parquet

列式存储,是一个面向列的二进制文件格式(不可直接读取),文件中包含数据和元数据,所以该存储格式是自解析的,在大型查询时效率很快高效,parquet主要用在存储多层嵌套式数据上提供良好的性能支持,默认采用uncompressed不压缩方式。

2.压缩方式

gzip、zlib、snappy、lzo 这四种压缩方式。 压缩不会改变元数据的分割性,即压缩后原来的值不变。

建表声明语句是:tblproperties("orc.compress"="SNAPPY")

压缩率的话:gzip压缩率最佳,但压缩解压缩速度较慢
压缩速度的话:snappy压缩解压缩速度最佳,但压缩率较低
是否可切片的话:gzip/snappy/zlib是不支持切片,而lzo支持切片

3.应用场景

选压缩方式

1.数据量极其大且不经常用来做计算的数据,可采用GZip,因为其压缩占比最高,但压缩解压缩速度最慢。
2.数据量不大且经常需要用来计算的数据,可采用Snappy或者Lzo,常常还用来搭配orc和parquet存储格式实现大幅度的数据压缩存储。

选存储格式

1.hive生产环境下时常是采用orc或者parquet这2种存储格式,但最好是做好统一,别一个数仓里的表存储格式百花齐放我建议就是数仓各层统一采用orc存储格式,拥有一定的压缩率且压缩解压缩速度也适中
2.orc存储格式+zlib压缩方式适合用作数仓ODS层表设计,因为这层一般是业务贴源层来入库数据和备份,查询频率打不大,而orc存储格式+snappy压缩方式适合用作数仓DW层表设计,这公共层表一般查询较频繁,所以要考虑下查询时解压缩速度
3.一般数据量预测会很大的话才不选用orc存储格式,主要是为了避免map端数据倾斜,因为orc+snappy不支持分割文件操作,所以压缩文件只会被一个任务读取,压缩文件很大的话就会造成mapper处理该文件极其耗时,这就是所谓的map读取文件出现数据倾斜


文章转载自:
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://.
http://www.tj-hxxt.cn/news/38161.html

相关文章:

  • wordpress 8个安全密匙甘肃新站优化
  • 域名历史解析查询seo是什么意思电商
  • 做短连接的网站东莞网站制作十年乐云seo
  • 网站建设成本预算seo如何优化网站推广
  • 怎么看网站是谁家做的seo深度优化公司
  • 房地产企业网站建设北京官方seo搜索引擎优化推荐
  • 做网站页面一般用什么软件怎样做推广是免费的
  • 网站建设飠金手指排名十一app推广员怎么做
  • 安徽优化推广重庆网站搜索引擎seo
  • 分享网站制作seo信息查询
  • 做网站背景的图片培训课程设计
  • 怎么做批量的网站检查seo关键词排名优化费用
  • 深圳市住房和建设局网站->认租申请贵州seo推广
  • 翻页h5制作软件网站排名优化公司
  • 医疗今科云平台网站建设技术开发爱站工具查询
  • 腾讯云网站建设流程图刚刚地震最新消息今天
  • cms做网站不用后端免费b2b平台推广
  • 更换wordpress语言包seo主要做什么工作内容
  • 赤峰做网站的网络公司大连网络推广
  • wordpress地址和站点地址有什么用百度竞价排名榜
  • 微信开发小程序开发网站建设爱站工具查询
  • 商城网站需要多少钱百度关键词规划师入口
  • 城阳网站改版百度关键词排名推广工具
  • 做付费软件网站创建软件平台该怎么做
  • wordpress 利用工具英文谷歌seo
  • 网站如何做等保备案googleplay商店
  • 网站架构师招聘google安卓手机下载
  • 免费人才招聘网站昆明网络营销公司哪家比较好
  • 网站制作需要多少钱新闻杭州seo公司服务
  • vi设计公司网站windows优化大师官方网站