当前位置: 首页 > news >正文

广告网站有哪些重庆市城市建设档案馆官方网站

广告网站有哪些,重庆市城市建设档案馆官方网站,内网域名,网站建设 系统 排名#x1f3e1; 个人主页#xff1a;IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客 #x1f6a9; 私聊博主#xff1a;加入大数据技术讨论群聊#xff0c;获取更多大数据资料。 #x1f514; 博主个人B栈地址#xff1a;豹哥教你大数据的个人空间-豹… 个人主页IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客   私聊博主加入大数据技术讨论群聊获取更多大数据资料。   博主个人B栈地址豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频 目录 1. 业务处理-单体架构 2. 业务处理-微服务架构 3. 数据分析-大数据Lambda架构 ​​​​​​​4. 有状态流计算架构 近年来随着越来越多的大数据技术被开源例如HDFS、Spark等伴随这些技术的发展与普及促使企业数据架构的演进——从传统的关系型数据存储架构逐步演化为分布式处理和存储的架构。我们通过数据架构的演变角度来了解下为什么今天Flink实时计算引擎会爆火起来。 ​​​​​​​1. 业务处理-单体架构 传统单体架构最大的特点是集中式数据存储一个企业中可能有很多业务系统例如订单系统、CRM系统、ERP系统等这些系统的数据一般存储在关系型数据库中这些存储的数据一般反应当前的业务状态也就是存储的是支撑业务正常运转的事务数据例如系统订单交易量、网站活跃用户数、每个用户在线的状态等针对这些数据库的操作也主要是增删改查操作单体架构如下 单体架构初期的效率很高但是随着时间的推移业务越来越多业务系统逐渐变得庞大越来越难维护与升级并且不同的业务系统之间可能有一些共同的业务模块并且一单业务系统依赖的数据库有问题会导致整个业务系统变的不可用为了解决以上问题企业开始逐渐采用微服务架构作为企业业务系统的架构体系。 ​​​​​​​2. 业务处理-微服务架构 微服务架构的核心思想是一个应用由多个小的、相互独立的微服务组成这些服务运行在自己的进程中开发和发布都没有依赖不同的服务能依据不同的业务需求构建不同的技术架构之上组成不同的业务系统应用。 微服务架构将系统拆解成不同独立的服务模块每个模块分别使用各自独立的数据库这种模式解决了业务系统的扩展问题也带来了新的问题——业务交易数据过于分散在不同的系统中很难将数据进行集中化管理。微服务架构如下 无论是单体架构还是微服务架构主要针对的还是企业的业务系统也就是业务平台对应的数据库存储的数据也是增删改查的事务型数据这些业务系统上主要进行的也是OLTP业务操作对于企业内部进行数据分析(OLAP分析)或者数据挖掘之类的应用则需要通过从不同的数据库中进行数据抽取将数据从不同的数据库中进行周期性同步到数据仓库中然后在数据仓库中进行统一规范的清洗分析处理最终结果提供给不同的数据集市和应用。 ​​​​​​​3. 数据分析-大数据Lambda架构 最初很多公司构建分析系统对应的数据仓库都是基于关系型数据库之上例如MySQL、Oracle数据库但是随着企业数据量的增长关系型数据库已经无法支撑海量数据集的存储与分析这时随着大数据相关技术的兴起很多企业基于大数据相关技术构建数据分析对应的数据仓库例如Hadoop中的HDFS 、Hive。 基于大数据平台构建数据仓库的过程数据往往都是周期性的从业务系统中同步到大数据平台完成一系列ETL转换操作后最终形成报表数据提供给数据集市展示使用这就是通常我们说的离线数据分析。但是对于一些实时性要求比较高的应用例如实时报表系统则必须有非常低的延时展示统计结果这就是我们说的实时数据分析。企业中这个时期采用Lambda架构来处理离线数据和实时数据的分析大数据Lambda架构如下 Lambda架构在一定程度上解决了不同计算场景问题但是带来的问题是框架太多导致平台复杂度过高、运维成本高例如在这个时期要完成离线计算需要使用Hive、MapReduce离线计算框架完成实时计算需要使用Storm实时计算框架对相应的开发和维度带来很高的成本。 后来随着Apache Spark分布式计算框架的出现Spark可以处理离线数据同时可以将实时数据作为微批处理来应对实时处理场景总之Spark可以让Lambda架构使用一套计算框架完成批处理和实时处理计算但是Spark本身是基于批数据处理模式处理流式数据并不能完美高效的处理实时要求非常高的场景。 关于大数据分析架构演变过程中在大数据中除了有Lambda架构之外还有Kappa架构、混合架构及湖仓一体架构以上各个架构都是在大数据不同时期针对公司业务数据分析场景提出的都是解决企业数据分析过程中业务痛点问题的架构关于其他架构更详细内容可以参照实时数仓相关课程。 ​​​​​​​4. 有状态流计算架构 Lambda架构中针对实时数据处理我们可以使用Spark计算框架进行分析Spark针对实时数据进行分析本质是将实时流数据看成微批进行处理数据产生的本质是一条条真实的事件这种处理实际上针对实时流事件分析有一定的延迟很难在实时计算过程中进行实时计算并直接产生统计结果因为这需要计算框架满足高性能、高吞吐、低延时等目标。随着有状态流计算架构的提出从一定程度上满足了企业对实时流数据处理的高性能、高吞吐、低延时目标企业可以基于实时的流式数据维护所有计算过程的状态所谓状态就是计算过程中产生的中间计算结果每次计算新的数据进入到流式系统中都是基于中间状态结果的基础上进行运算最终产生正确的统计结果。 基于有状态计算的方式最大的优势是不需要将原始数据重新从外部存储中拿出来从而进行全量计算因为这种计算方式的代价可能是非常高的。从另一个角度讲用户无须通过调度和协调各种批量计算工具从数据仓库中获取数据统计结果然后再落地存储这些操作全部都可以基于流式计算完成可以极大地减轻系统对其他框架的依赖减少数据计算过程中的时间损耗以及硬件存储。有状态计算架构如下 可以看出有状态流计算架构将会逐步成为企业作为构建数据平台的架构模式Apache Flink就是有状态的流计算架构通过实现Google Dataflow流式计算模型实现了高吞吐、低延迟、高性能兼具的实时流式计算框架同时Flink支持高度容错的状态管理防止状态在计算过程中因为系统异常而出现数据丢失Flink周期性地通过分布式快照技术Checkpoints实现状态的持久化维护即使在系统停机或者异常情况下都能正确的计算出来结果。
http://www.tj-hxxt.cn/news/230264.html

相关文章:

  • 网站制作如何做西安造价信息网官网
  • 公司网站域名价格市场营销推广方案
  • 重庆所有做网站的公司新闻今天的最新新闻
  • 珠海建设改革有哪些网站高品质网站建设公司
  • 免费手机网站appWordPress手机aop主题
  • 个人网站怎么做内容比较好盘锦市建设局网站地址
  • 仿美团版网站开发制作网站建设的基本步骤
  • 做透水砖的网站深圳广告策划公司排名
  • 网站界面设计策划书怎么做wordpress如何配置前端用户中心
  • 六盘水南宁网站建设昆明网站建设知名企业
  • 上海城市建设网站专业软件开发培训机构
  • 网站建设seo基本要求自己做一个网站难不难
  • 偷dede网站模板打开网站建设中是什么意思
  • 网站必须做电子标识信息罗湖做网站公司排名
  • 南阳提高网站排名网站建设计划书1200字
  • 昆明市建设局官方网站查学校去哪个网站
  • 网站升级建设方案工业云网站建设
  • 无锡网站制作中心我想要个网站
  • 静态网站 后台seo专员简历
  • 服务器添加网站电子商城网站建设报告
  • 做外贸怎么进入国外的网站电商商城网站建设
  • 重庆网站备案快改网站字体颜色代码
  • 京东网站建设设计框架图重庆seo排名方法
  • 建设银行网站用360浏览器做公司网站需注意什么
  • 宁波专业网站制作设计网站备案怎么查
  • 仿京东电商的网站开发报价做网站到八方资源网怎么样
  • 织梦 网站地图 样式wordpress 添加 常规
  • 网站做优化一般几个字wordpress网页如何上传下载
  • 哪种网站名称容易通过备案审核数据库怎么做两个网站
  • 合肥百度团购网站建设律师用的网站模板