当前位置: 首页 > news >正文

纺织品公司网站建设seo赚钱暴利

纺织品公司网站建设,seo赚钱暴利,asp.net jsp 网站,有什么做外贸的好网站个人博客地址:Sqoop源码修改:增加落地HDFS文件数与MapTask数量一致性检查 | 一张假钞的真实世界 本篇是对记录一次Sqoop从MySQL导入数据到Hive问题的排查经过的补充。 Sqoop 命令通过 bin 下面的脚本调用,调用如下: exec ${HAD…

个人博客地址:Sqoop源码修改:增加落地HDFS文件数与MapTask数量一致性检查 | 一张假钞的真实世界

本篇是对记录一次Sqoop从MySQL导入数据到Hive问题的排查经过的补充。

Sqoop 命令通过 bin 下面的脚本调用,调用如下:

exec ${HADOOP_COMMON_HOME}/bin/hadoop org.apache.sqoop.Sqoop "$@"

org.apache.sqoop.Sqoop 是 Sqoop 的入口类,在此主要是解析参数及初始化工具类,然后通过 org.apache.hadoop.util.ToolRunner 类调用对应的工具完成操作。Sqoop 的 Import 操作对应的是 org.apache.sqoop.tool.ImportTool 类。

在 ImportTool 类的 return 代码前增加以下代码:

int numMappers = options.getNumMappers();String hDbName = options.getHCatDatabaseName();
String hTableName = options.getHCatTableName();
String hPartKeys = options.getHCatalogPartitionKeys();
String hPartVals = options.getHCatalogPartitionValues();if(isStringNotEmpty(hDbName) && isStringNotEmpty(hTableName) && isStringNotEmpty(hPartKeys) &&     isStringNotEmpty(hPartVals)) {String[] partKeys = hPartKeys.split(",");String[] partVals = hPartVals.split(",");String partPathStr = "";if(partKeys.length > 0 && partVals.length == partKeys.length) {for(int i = 0; i < partKeys.length; i++) {partPathStr += partKeys[i] + "=" + partVals[i] + "/";}}String targetDir = "/user/hive/warehouse/" + hDbName + ".db/" + hTableName + "/" + partPathStr;targetDir = targetDir.toLowerCase();LOG.info("---------targetDir=" + targetDir);try {FileSystem fs = FileSystem.get(options.getConf());RemoteIterator<LocatedFileStatus> rIter = fs.listFiles(new Path(targetDir), false);int fileCount = 0;while(rIter.hasNext()) {fileCount++;rIter.next();}LOG.info("---------------fileCount=" + fileCount);if(numMappers != fileCount) {LOG.error("files number in hdfs not equals mapper task number !");return 2;}} catch (IOException e) {LOG.error("count files number from hdfs error !");e.printStackTrace();return 3;}
}

改动只针对 Sqoop 集成 HCatalog 方式导入 ORC 格式的情况。因为我们的数据仓库中都采用的是这种方式。

优化:当 MySQL 中记录数特别少时,如少于 4 条记录,则默认 Sqoop 的 MapTask 数量为 4 但其实际执行时因为原始记录数不够则实际执行的 MapTask 数量会跟实际的记录数一致,此时 split 数量跟落地 HDFS 的文件数量一致。所以,可以根据 Sqoop 对应 MR 的实际 split 数量进行判断文件数量。

http://www.tj-hxxt.cn/news/12369.html

相关文章:

  • 番禺网站制作女性广告
  • 大朗做网站b2b平台排名
  • 网站首页布局设计教程外贸网站推广怎么做
  • 胶州网站建设爱站seo
  • 怎么将自己做的网站发到网上去什么网站都能进的浏览器
  • ui培训时间seo网址超级外链工具
  • 抚州市建设局官网站百度竞价排名
  • 福田网站建设方案网页设计与制作步骤
  • 佛山新网站制作平台百度运营推广
  • 网站搜索引擎友好性分析湖南优化推广
  • 鲜花网站设计万网官网登录
  • 深圳手机网站建设价格b2b网站大全免费
  • 禹城网站建设电话网络营销主要是什么
  • 个人工作室网站怎么做北京百度网讯科技有限公司
  • 网站icp和公安备案电商运营模式
  • 做外汇网站做什么类型网站好网站是怎么优化推广的
  • 网络推广网站建设有限公司seo包括什么
  • 做的时间长的网站制作公司有什么平台可以发布推广信息
  • 路飞和女帝做h的网站给网站做seo的价格
  • 网站开发类毕业设计合肥网
  • wordpress评论特效扬州seo博客
  • 网站联系我们模板怎样做推广更有效
  • 个人网站建设方案策划书百度seo多少钱一个月
  • 中国人民银行网点seo教程网站
  • 基于多站点的网站内容管理平台的管理与应用中国搜索引擎大全
  • 外国人做僾视频网站免费打广告网站
  • 阿里网站建设长春网站建设定制
  • wordpress手机端编辑seo网站优化收藏
  • wordpress 表白主题seo关键词排名优化系统源码
  • 乌鲁木齐做网站的公司百度推广怎么添加关键词