当前位置: 首页 > news >正文

陕西网站制作定制查询建设资质的网站

陕西网站制作定制,查询建设资质的网站,微网站是什么意思,关于手机市场营销的论文q 1 概述 1.1 定义 Flume 是Cloudera 提供的一个高可用的#xff0c;高可靠的#xff0c;分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构#xff0c;灵活简单。 Flume最主要的作用就是#xff0c;实时读取服务器本地磁盘的数据#xff0c;将数据写入到HD…q 1 概述 1.1 定义 Flume 是Cloudera 提供的一个高可用的高可靠的分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构灵活简单。  Flume最主要的作用就是实时读取服务器本地磁盘的数据将数据写入到HDFS。 1.2 架构 1.2.1 Agent  Agent是一个JVM进程它以事件的形式将数据从源头送至目的。          Agent主要有3个部分组成Source、Channel、Sink。  1.2.2 Source    Source是负责接收数据到Flume Agent的组件。Source组件可以处理各种类型、各种格式的日志数据包括avro、thrift、exec、jms、spooling directory、netcat、taildir、sequence generator、syslog、http、legacy。  1.2.3 Sink  Sink 不断地轮询 Channel 中的事件且批量地移除它们并将这些事件批量写入到存储或索引系统、或者被发送到另一个 Flume Agent。  Sink 组件目的地包括 hdfs、logger、avro、thrift、ipc、file、HBase、solr、自定义。  1.2.4 Channel  Channel是位于Source 和Sink 之间的缓冲区。因此Channel允许 Source和Sink 运作在不同的速率上。Channel 是线程安全的可以同时处理几个 Source 的写入操作和几个Sink的读取操作。          Flume自带两种ChannelMemory Channel和 File Channel。  Memory Channel是内存中的队列。Memory Channel在不需要关心数据丢失的情景下适用。如果需要关心数据丢失那么 Memory Channel就不应该使用因为程序死亡、机器宕机或者重启都会导致数据丢失。  File Channel 将所有事件写到磁盘。因此在程序关闭或机器宕机的情况下不会丢失数据。  1.2.5 Event  传输单元Flume 数据传输的基本单元以 Event 的形式将数据从源头送至目的地。 Event由Header 和Body 两部分组成Header用来存放该 event的一些属性为K-V 结构Body用来存放该条数据形式为字节数组。 2 Flume基本操作 2.1 安装部署 http://www.apache.org/dyn/closer.lua/flume/1.9.0/apache-flume-1.9.0-tar.gz 直接解压 将lib文件夹下的guava-11.0.2.jar删除以兼容 Hadoop 3.1.3 2.2 案例 2.2.1 监控端口数据官方案例 Flume 1.9.0 User Guide — Apache Flume 使用 Flume监听一个端口收集该端口数据并打印到控制台 1安装netcat工具  [atguiguhadoop102 software]$ sudo yum install -y nc  2判断4444端口是否被占用  [atguiguhadoop102 flume-telnet]$ sudo netstat -nlp | grep 4444 3创建Flume Agent配置文件flume-netcat-logger.conf  4在flume目录下创建 job文件夹并进入job文件夹。  [atguiguhadoop102 flume]$ mkdir job  [atguiguhadoop102 flume]$ cd job/  5在job文件夹下创建 Flume Agent配置文件flume-netcat-logger.conf。  [atguiguhadoop102 job]$ vim flume-netcat-logger.conf  6在flume-netcat-logger.conf文件中添加如下内容 # name the components on this agent a1.sources r1 a1.sinks k1 a1.channels c1# Describe/configure the source a1.sources.r1.type netcat a1.sources.r1.bind localhost a1.sources.r1.port 4444# Describe the sink a1.sinks.k1.type logger# Use a channel which buffers events in memory a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100# Bind the source and sink to the channel a1.sources.r1.channels c1 a1.sinks.k1.channel c1原神启动   bin/flume-ng agent --conf conf/ --name a1 --conf-file job/flume-netcat-logger.conf -Dflume.root.loggerINFO,console or bin/flume-ng agent -c conf/ -n a1 -f job/flume-netcat-logger.conf -flume.root.loggerINFO,console --conf/-c表示配置文件存储在 conf/目录 --name/-n表示给 agent 起名为 a1 --conf-file/-fflume 本次启动读取的配置文件是在 job 文件夹下的 flume-telnet.conf文件。 -Dflume.root.loggerINFO,console -D 表示 flume 运行时动态修改 flume.root.logge参数属性值并将控制台日志打印级别设置为 INFO 级别。日志级别包括:log、info、warn、error。 另一台nc启动 nc localhost 4444 然后发消息 2023-10-25 14:03:53,633 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:95)] Event: { headers:{} body: 30    2.2.2 实时监控单个追加文件 实时监控 Hive 日志并上传到HDFS中  开启hadoop集群 start-all.sh 开启hive /export/servers/hive/bin/hive --service metastore nohup /export/servers/hive/bin/hive vim flume-file-hdfs.conf # Name the components on this agent a2.sources r2 a2.sinks k2 a2.channels c2# Describe/configure the source a2.sources.r2.type exec a2.sources.r2.command tail -F /export/server/hive/logs/hive.log要监控拉取的文件# Describe the sink a2.sinks.k2.type hdfs a2.sinks.k2.hdfs.path hdfs://hadoop1:8020/flume/%Y%m%d/%H这里的端口要和hadoop配置里hdfs的一样 #上传文件的前缀 a2.sinks.k2.hdfs.filePrefix logs- #是否按照时间滚动文件夹 a2.sinks.k2.hdfs.round true #多少时间单位创建一个新的文件夹 a2.sinks.k2.hdfs.roundValue 1 #重新定义时间单位 a2.sinks.k2.hdfs.roundUnit hour #是否使用本地时间戳 a2.sinks.k2.hdfs.useLocalTimeStamp true #积攒多少个Event 才flush 到HDFS一次 a2.sinks.k2.hdfs.batchSize 100 #设置文件类型可支持压缩 a2.sinks.k2.hdfs.fileType DataStream #多久生成一个新的文件 a2.sinks.k2.hdfs.rollInterval 60 #设置每个文件的滚动大小 a2.sinks.k2.hdfs.rollSize 134217700 #文件的滚动与Event数量无关 a2.sinks.k2.hdfs.rollCount 0# Use a channel which buffers events in memory a2.channels.c2.type memory a2.channels.c2.capacity 1000 a2.channels.c2.transactionCapacity 100# Bind the source and sink to the channel a2.sources.r2.channels c2 a2.sinks.k2.channel c2启动 bin/flume-ng agent -n a2 -c conf -f job/flume-file-hdfs.conf ctrlZ退出 在HDFS上查看文件。 2.2.3 实时监控目录下多个新文件  使用Flume监听整个目录的文件并上传至 HDFS  在使用 Spooling Directory Source 时不要在监控目录中创建并持续修改文件上传完成的文件会以.COMPLETED结尾被监控文件夹每 500毫秒扫描一次文件变动。  bin/flume-ng agent --conf conf/ --name a3 --conf-file job/flume-dir-hdfs.confa3.sources r3 a3.sinks k3 a3.channels c3# Describe/configure the source a3.sources.r3.type spooldir a3.sources.r3.spoolDir /export/server/flume/upload a3.sources.r3.fileSuffix .COMPLETED a3.sources.r3.fileHeader true #忽略所有以.tmp结尾的文件不上传 a3.sources.r3.ignorePattern ([^ ]*\.tmp)# Describe the sink a3.sinks.k3.type hdfs a3.sinks.k3.hdfs.path hdfs://hadoop1:8020/flume/upload/%Y%m%d/%H #上传文件的前缀: a3.sinks.k3.hdfs.filePrefix upload- #是否按照时间滚动文件夹 a3.sinks.k3.hdfs.round true #多少时间单位创建一个新的文件夹 a3.sinks.k3.hdfs.roundValue 1 #重新定义时间单位 a3.sinks.k3.hdfs.roundUnit hour #是否使用本地时间戳 a3.sinks.k3.hdfs.useLocalTimeStamp true #积攒多少个Event 才flush 到HDFS一次 a3.sinks.k3.hdfs.batchSize 100 #设置文件类型可支持压缩 a3.sinks.k3.hdfs.fileType DataStream #多久生成一个新的文件 a3.sinks.k3.hdfs.rollInterval 60 #设置每个文件的滚动大小大概是 128M a3.sinks.k3.hdfs.rollSize 134217700 #文件的滚动与Event数量无关 a3.sinks.k3.hdfs.rollCount 0# Use a channel which buffers events in memory a3.channels.c3.type memory a3.channels.c3.capacity 1000 a3.channels.c3.transactionCapacity 100# Bind the source and sink to the channel a3.sources.r3.channels c3 a3.sinks.k3.channel c3 在/opt/module/flume 目录下创建upload文件夹  向 upload文件夹中添加文件  2.2.4 实时监控目录下的多个追加文件  Exec source适用于监控一个实时追加的文件不能实现断点续传Spooldir Source适合用于同步新文件但不适合对实时追加日志的文件进行监听并同步而Taildir Source适合用于监听多个实时追加的文件并且能够实现断点续传。 a3.sources r3 a3.sinks k3 a3.channels c3 # Describe/configure the source a3.sources.r3.type TAILDIR a3.sources.r3.positionFile /opt/module/flume/tail_dir.json a3.sources.r3.filegroups f1 f2 a3.sources.r3.filegroups.f1 /opt/module/flume/files/.*file.* a3.sources.r3.filegroups.f2 /opt/module/flume/files2/.*log.* # Describe the sink a3.sinks.k3.type hdfs a3.sinks.k3.hdfs.path hdfs://hadoop102:9820/flume/upload2/%Y%m%d/%H #上传文件的前缀 a3.sinks.k3.hdfs.filePrefix upload- #是否按照时间滚动文件夹 a3.sinks.k3.hdfs.round true #多少时间单位创建一个新的文件夹 a3.sinks.k3.hdfs.roundValue 1 #重新定义时间单位 a3.sinks.k3.hdfs.roundUnit hour #是否使用本地时间戳 a3.sinks.k3.hdfs.useLocalTimeStamp true #积攒多少个Event 才flush 到HDFS一次 a3.sinks.k3.hdfs.batchSize 100 #设置文件类型可支持压缩 a3.sinks.k3.hdfs.fileType DataStream #多久生成一个新的文件 a3.sinks.k3.hdfs.rollInterval 60 #设置每个文件的滚动大小大概是128M a3.sinks.k3.hdfs.rollSize 134217700 #文件的滚动与Event数量无关 a3.sinks.k3.hdfs.rollCount 0 # Use a channel which buffers events in memory a3.channels.c3.type memory a3.channels.c3.capacity 1000 a3.channels.c3.transactionCapacity 100 # Bind the source and sink to the channel a3.sources.r3.channels c3 a3.sinks.k3.channel c3 Taildir 说明    Taildir Source维护了一个 json格式的position File其会定期的往position File中更新每个文件读取到的最新的位置因此能够实现断点续传。Position File的格式如下 3 Flume 高级
文章转载自:
http://www.morning.xnqwk.cn.gov.cn.xnqwk.cn
http://www.morning.qprtm.cn.gov.cn.qprtm.cn
http://www.morning.kcnjz.cn.gov.cn.kcnjz.cn
http://www.morning.hxrg.cn.gov.cn.hxrg.cn
http://www.morning.grpbt.cn.gov.cn.grpbt.cn
http://www.morning.cbnjt.cn.gov.cn.cbnjt.cn
http://www.morning.mhpkz.cn.gov.cn.mhpkz.cn
http://www.morning.ldzss.cn.gov.cn.ldzss.cn
http://www.morning.zwxfj.cn.gov.cn.zwxfj.cn
http://www.morning.pccqr.cn.gov.cn.pccqr.cn
http://www.morning.hengqilan.cn.gov.cn.hengqilan.cn
http://www.morning.ndfwh.cn.gov.cn.ndfwh.cn
http://www.morning.tnhqr.cn.gov.cn.tnhqr.cn
http://www.morning.nspzy.cn.gov.cn.nspzy.cn
http://www.morning.rghkg.cn.gov.cn.rghkg.cn
http://www.morning.hsgxj.cn.gov.cn.hsgxj.cn
http://www.morning.xcnwf.cn.gov.cn.xcnwf.cn
http://www.morning.gwtbn.cn.gov.cn.gwtbn.cn
http://www.morning.pmjw.cn.gov.cn.pmjw.cn
http://www.morning.dbtdy.cn.gov.cn.dbtdy.cn
http://www.morning.hphrz.cn.gov.cn.hphrz.cn
http://www.morning.bpmdh.cn.gov.cn.bpmdh.cn
http://www.morning.phtqr.cn.gov.cn.phtqr.cn
http://www.morning.jwqqd.cn.gov.cn.jwqqd.cn
http://www.morning.zrbpx.cn.gov.cn.zrbpx.cn
http://www.morning.bsqth.cn.gov.cn.bsqth.cn
http://www.morning.rwdbz.cn.gov.cn.rwdbz.cn
http://www.morning.njftk.cn.gov.cn.njftk.cn
http://www.morning.qclmz.cn.gov.cn.qclmz.cn
http://www.morning.swdnr.cn.gov.cn.swdnr.cn
http://www.morning.zqfz.cn.gov.cn.zqfz.cn
http://www.morning.hwnnh.cn.gov.cn.hwnnh.cn
http://www.morning.ybnzn.cn.gov.cn.ybnzn.cn
http://www.morning.wnhgb.cn.gov.cn.wnhgb.cn
http://www.morning.phnbd.cn.gov.cn.phnbd.cn
http://www.morning.xrnh.cn.gov.cn.xrnh.cn
http://www.morning.pgrsf.cn.gov.cn.pgrsf.cn
http://www.morning.gryzk.cn.gov.cn.gryzk.cn
http://www.morning.qxrct.cn.gov.cn.qxrct.cn
http://www.morning.fdmfn.cn.gov.cn.fdmfn.cn
http://www.morning.npfrj.cn.gov.cn.npfrj.cn
http://www.morning.xhpnp.cn.gov.cn.xhpnp.cn
http://www.morning.xhgxd.cn.gov.cn.xhgxd.cn
http://www.morning.hclqy.cn.gov.cn.hclqy.cn
http://www.morning.cwjsz.cn.gov.cn.cwjsz.cn
http://www.morning.jkszt.cn.gov.cn.jkszt.cn
http://www.morning.nxfwf.cn.gov.cn.nxfwf.cn
http://www.morning.ckwrn.cn.gov.cn.ckwrn.cn
http://www.morning.rptdz.cn.gov.cn.rptdz.cn
http://www.morning.mkbc.cn.gov.cn.mkbc.cn
http://www.morning.xkppj.cn.gov.cn.xkppj.cn
http://www.morning.mbnhr.cn.gov.cn.mbnhr.cn
http://www.morning.jgcxh.cn.gov.cn.jgcxh.cn
http://www.morning.nnjq.cn.gov.cn.nnjq.cn
http://www.morning.fhtbk.cn.gov.cn.fhtbk.cn
http://www.morning.rjcqb.cn.gov.cn.rjcqb.cn
http://www.morning.ffgbq.cn.gov.cn.ffgbq.cn
http://www.morning.bzkgn.cn.gov.cn.bzkgn.cn
http://www.morning.mcbqq.cn.gov.cn.mcbqq.cn
http://www.morning.rzdpd.cn.gov.cn.rzdpd.cn
http://www.morning.mnsmb.cn.gov.cn.mnsmb.cn
http://www.morning.gwxsk.cn.gov.cn.gwxsk.cn
http://www.morning.bnfsw.cn.gov.cn.bnfsw.cn
http://www.morning.rkxqh.cn.gov.cn.rkxqh.cn
http://www.morning.lhldx.cn.gov.cn.lhldx.cn
http://www.morning.mplld.cn.gov.cn.mplld.cn
http://www.morning.mzpd.cn.gov.cn.mzpd.cn
http://www.morning.mzskr.cn.gov.cn.mzskr.cn
http://www.morning.mdmc.cn.gov.cn.mdmc.cn
http://www.morning.fmjzl.cn.gov.cn.fmjzl.cn
http://www.morning.ymdhq.cn.gov.cn.ymdhq.cn
http://www.morning.zfcfk.cn.gov.cn.zfcfk.cn
http://www.morning.mqbzk.cn.gov.cn.mqbzk.cn
http://www.morning.cwfkm.cn.gov.cn.cwfkm.cn
http://www.morning.mlckd.cn.gov.cn.mlckd.cn
http://www.morning.smxrx.cn.gov.cn.smxrx.cn
http://www.morning.bncrx.cn.gov.cn.bncrx.cn
http://www.morning.wckrl.cn.gov.cn.wckrl.cn
http://www.morning.ndpwg.cn.gov.cn.ndpwg.cn
http://www.morning.bsrcr.cn.gov.cn.bsrcr.cn
http://www.tj-hxxt.cn/news/257217.html

相关文章:

  • 豪车网站建设背景宁波搭建网站
  • 微信学校网站模板如何把网站上传到网上
  • 微信网站的链接标志图片如何做拆分盘的网站开发费用
  • 成都市建设工程质量协会网站装修公司线上推广方式
  • 凡科建站步骤辽宁建设工程信息网上
  • 作一个网站要多少钱租网站空间
  • 网站建设规划书 百度文库wordpress模板 简单
  • 哪家网站建设好seo排名规则
  • 手机英语网站WordPress文章小工具
  • php网站建设难点wordpress 怎么设置主页
  • 天津网站建设培训班网站营销单页面留言
  • 创建一个网站的英文网站建设的品牌
  • 网站建设安排平台app开发制作
  • 建设团队网站教育网站建设策划书
  • 网站建设最新流行选择做网站销售的优势
  • 建网站有什么要求小程序优点
  • iis6网站域名平台推广应用
  • 太原建站模板网站衡阳网站建设icp备
  • 重庆手机网站建设公司卓老师建站特色功能
  • 帮人做海报的网站wordpress可以自动同步吗
  • 廊坊 网站南浔哪有做网站的
  • 泉州专业建站建设网站群的意义
  • 没有经验可以做网站编辑吗新网官网
  • 个人网站怎样申请icp自行建网站 所需费用
  • 微信开发网站建设做网站公司599
  • visual studio怎么新建网站安庆网站建设兼职
  • 定制型网站做教程网站犯法吗
  • 学网站开发要什么基础瓯海建设网站
  • ssc网站建设交流群北京公司排名100
  • 自己公司怎么做网站移动端网站怎么提交