当前位置: 首页 > news >正文

廊坊网站关键词排名产品推广方案范例

廊坊网站关键词排名,产品推广方案范例,那里可以做app网站,wordpress 安全加固背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive 问题:单表日800亿数据量,产生过多的小文件,影响Impala查询 解决:对hive小文件进行合并, ALTER TABLE lt_ipsy_xdr_temp PARTITION (day20230829, hour9,type…

背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive

问题:单表日800亿数据量,产生过多的小文件,影响Impala查询

解决:对hive小文件进行合并,

ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

目前大数据平台hdfs数据存储情况:

数据仓库中的表:
1.stg层是把flink应用程序写入的数据load进入的;
2.ods层表名称中包含ai的表是从mysql导入的; 
/_SCRATCH0 这些目录是sqoop 把mysql数据导入hive时生成的临时目录,可以删除。
3.stg 和 ods 的 tb_bu_dc_monitor_day 是外部表,其他层的表都是内部表;
4.stg层是原始数据,没有经过压缩处理,ods及以后其他各层都是orc格式
 

使用hive concatenate (外部表不可用,内部表可用,orc可用,分桶表不可用)
使用方式:

#1.设置文件最小大小(需要设置,否则合并操作可能会不理想):
SET mapreduce.input.fileinputformat.split.maxsize=256
#对于非分区表
alter table A concatenate;
#2.对于分区表
ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

因为分桶表不适用,所以可以采用覆写的方式

INSERT OVERWRITE TABLE table 

PARTITION (day=20230908,hour=9,datatype=4)
SELECT 
a,b,c,d,e
FROM table 
where day=20230908 and hour=9 and datatype=4;

http://www.tj-hxxt.cn/news/20507.html

相关文章:

  • web网站开发 框架360地图怎么添加商户
  • 怎么查一个网站是谁做的关键词优化一年的收费标准
  • 心理咨询网站开发谷歌手机版下载安装
  • 目前网站开发有什么缺点现在做网络推广都有什么方式
  • 亚马逊购物seo优化中商品权重主要由什么决定
  • 成都网站建设排名网站设计是做什么的
  • 网站建设与推广话术百度舆情
  • 动态网站开发过程ppt如何做网络推广人员
  • 而的跟地seo排名点击软件深圳seo优化排名优化
  • 做设计用的素材下载网站有哪些好用的磁力搜索引擎
  • 社区门户网站规范化建设免费外链网站
  • 企业做网站的钱怎么做账百度网页版主页
  • 建设网站视频素材seo专员工作容易学吗
  • 个人网站能做淘宝客吗重庆疫情最新数据
  • 建设网站怎么挣钱搜索引擎营销名词解释
  • 网址域名注册局广州seo推广公司
  • 个人网站名字可以用哪些seo黑帽教程视频
  • 网站册数网站推广100种方法
  • 什么时候能用ipv6做网站软文广告成功案例
  • 商务局网站建设方案b站视频未能成功转码
  • 域名查询网138百度seo优化包含哪几项
  • 个人网站空间购买百度推广费用可以退吗
  • 移动网站构建品牌营销和市场营销的区别
  • 服务器做网站有什么好处如何建网站教程
  • 自助交友网站建设百度推广区域代理
  • 什么网站做adsense好seo优化排名价格
  • 辽宁省城乡建设厅网站重庆网站seo好不好
  • 制作一个静态网页关键词优化的策略
  • 做心灵鸡汤网站栏目排版百度搜索一下就知道
  • 山西晋城疫情防控最新消息乐天seo培训