当前位置: 首页 > news >正文

雅安网站建设公司建外贸网站的

雅安网站建设公司,建外贸网站的,文化建设的内容,达人设计网官方网站1、概念介绍 Spark是一个分布式计算框架#xff0c;用于处理大规模数据处理任务。在Spark中#xff0c;DataFrame是一种分布式的数据集合#xff0c;类似于关系型数据库中的表格。DataFrame提供了一种更高级别的抽象#xff0c;允许用户以声明式的方式处理数据#xff0c…1、概念介绍 Spark是一个分布式计算框架用于处理大规模数据处理任务。在Spark中DataFrame是一种分布式的数据集合类似于关系型数据库中的表格。DataFrame提供了一种更高级别的抽象允许用户以声明式的方式处理数据而不需要关心底层数据的细节和分布式计算的复杂性。Schema在Spark中用于描述DataFrame中的数据结构类似于表格中的列定义。 让我们分别介绍一下DataFrame和Schema DataFrame: DataFrame是由行和列组成的分布式数据集合类似于传统数据库或电子表格的结构。Spark的DataFrame具有以下特点 分布式计算DataFrame是分布式的可以在集群中的多个节点上进行并行处理以实现高性能的大规模数据处理。 不可变性DataFrame是不可变的这意味着一旦创建就不能修改。相反对DataFrame的操作会生成新的DataFrame。 延迟执行Spark采用了延迟执行策略即DataFrame上的操作并不立即执行而是在需要输出结果时进行优化和执行。 用户可以使用SQL语句、Spark的API或Spark SQL来操作DataFrame进行数据过滤、转换、聚合等操作。DataFrame的优势在于其易用性和优化能力Spark会根据操作的执行计划来优化整个计算过程以提高性能。 Schema: Schema是DataFrame中数据的结构描述它定义了DataFrame的列名和列的数据类型。在Spark中Schema是一个包含列名和数据类型的元数据集合。DataFrame的Schema信息对于优化计算和数据类型的正确解释至关重要。 通常Schema是在创建DataFrame时自动推断的也可以通过编程方式显式指定。指定Schema的好处是可以确保数据被正确解释并且避免潜在的类型转换错误。如果数据源不包含Schema信息或者需要修改Schema可以使用StructType和StructField来自定义Schema。例如可以创建一个包含多个字段和数据类型的Schema如字符串、整数、日期等。 在使用Spark读取数据源时如CSV文件、JSON数据、数据库表等Spark会尝试自动推断数据的Schema。如果数据源本身没有提供足够的信息可以使用schema选项来指定或者通过后续的数据转换操作来调整DataFrame的Schema。 总结DataFrame是Spark中一种强大的分布式数据结构允许用户以声明式的方式处理数据而Schema则用于描述DataFrame中数据的结构信息确保数据被正确解释和处理。这两个概念共同构成了Spark强大的数据处理能力。 代码实战 package test.scalaimport org.apache.spark.sql.SparkSession import org.apache.spark.sql.Row import org.apache.spark.sql.types.{IntegerType, StringType, StructType}object TestSchema {def getSparkSession(appName: String, localType: Int): SparkSession {val builder: SparkSession.Builder SparkSession.builder().appName(appName)if (localType 1) {builder.master(local[8]) // 本地模式启用8个核心}val spark builder.getOrCreate() // 获取或创建一个新的SparkSessionspark.sparkContext.setLogLevel(ERROR) // Spark设置日志级别spark}def main(args: Array[String]): Unit {println(Start TestSchema)val spark: SparkSession getSparkSession(TestSchema, 1)val structureData Seq(Row(36636, Finance, Row(3000, USA)),Row(40288, Finance, Row(5000, IND)),Row(42114, Sales, Row(3900, USA)),Row(39192, Marketing, Row(2500, CAN)),Row(34534, Sales, Row(6500, USA)))val structureSchema new StructType().add(id, StringType).add(dept, StringType).add(properties, new StructType().add(salary, IntegerType).add(location, StringType))val df spark.createDataFrame(spark.sparkContext.parallelize(structureData), structureSchema)df.printSchema()df.show(false)val row df.first()val schema row.schemaval structTypeList schema.toListprintln(structTypeList.size)for (i - 0 to structTypeList.size - 1) {val structType structTypeList(i)println(structType.name, row.getAs(structType.name), structType.dataType, structType.dataType)}} }输出 Start TestSchema Using Spark’s default log4j profile: org/apache/spark/log4j-defaults.properties 23/07/29 09:47:59 INFO SparkContext: Running Spark version 2.4.0 23/07/29 09:47:59 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable 23/07/29 09:47:59 INFO SparkContext: Submitted application: TestSchema 23/07/29 09:47:59 INFO SecurityManager: Changing view acls to: Nebula 23/07/29 09:47:59 INFO SecurityManager: Changing modify acls to: Nebula 23/07/29 09:47:59 INFO SecurityManager: Changing view acls groups to: 23/07/29 09:47:59 INFO SecurityManager: Changing modify acls groups to: 23/07/29 09:47:59 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(Nebula); groups with view permissions: Set(); users with modify permissions: Set(Nebula); groups with modify permissions: Set() 23/07/29 09:48:01 INFO Utils: Successfully started service ‘sparkDriver’ on port 60785. 23/07/29 09:48:01 INFO SparkEnv: Registering MapOutputTracker 23/07/29 09:48:01 INFO SparkEnv: Registering BlockManagerMaster 23/07/29 09:48:01 INFO BlockManagerMasterEndpoint: Using org.apache.spark.storage.DefaultTopologyMapper for getting topology information 23/07/29 09:48:01 INFO BlockManagerMasterEndpoint: BlockManagerMasterEndpoint up 23/07/29 09:48:01 INFO DiskBlockManager: Created local directory at C:\Users\Nebula\AppData\Local\Temp\blockmgr-6f861361-4d98-4372-b78a-2949682bd557 23/07/29 09:48:01 INFO MemoryStore: MemoryStore started with capacity 8.3 GB 23/07/29 09:48:01 INFO SparkEnv: Registering OutputCommitCoordinator 23/07/29 09:48:01 INFO Utils: Successfully started service ‘SparkUI’ on port 4040. 23/07/29 09:48:01 INFO SparkUI: Bound SparkUI to 0.0.0.0, and started at http://LAPTOP-PEA8R2PO:4040 23/07/29 09:48:01 INFO Executor: Starting executor ID driver on host localhost 23/07/29 09:48:01 INFO Utils: Successfully started service ‘org.apache.spark.network.netty.NettyBlockTransferService’ on port 60826. 23/07/29 09:48:01 INFO NettyBlockTransferService: Server created on LAPTOP-PEA8R2PO:60826 23/07/29 09:48:01 INFO BlockManager: Using org.apache.spark.storage.RandomBlockReplicationPolicy for block replication policy 23/07/29 09:48:01 INFO BlockManagerMaster: Registering BlockManager BlockManagerId(driver, LAPTOP-PEA8R2PO, 60826, None) 23/07/29 09:48:01 INFO BlockManagerMasterEndpoint: Registering block manager LAPTOP-PEA8R2PO:60826 with 8.3 GB RAM, BlockManagerId(driver, LAPTOP-PEA8R2PO, 60826, None) 23/07/29 09:48:01 INFO BlockManagerMaster: Registered BlockManager BlockManagerId(driver, LAPTOP-PEA8R2PO, 60826, None) 23/07/29 09:48:01 INFO BlockManager: Initialized BlockManager: BlockManagerId(driver, LAPTOP-PEA8R2PO, 60826, None)
文章转载自:
http://www.morning.wjxtq.cn.gov.cn.wjxtq.cn
http://www.morning.lsqmb.cn.gov.cn.lsqmb.cn
http://www.morning.ykrg.cn.gov.cn.ykrg.cn
http://www.morning.rcyrm.cn.gov.cn.rcyrm.cn
http://www.morning.cklgf.cn.gov.cn.cklgf.cn
http://www.morning.xnltz.cn.gov.cn.xnltz.cn
http://www.morning.lpzqd.cn.gov.cn.lpzqd.cn
http://www.morning.dwmmf.cn.gov.cn.dwmmf.cn
http://www.morning.jlgjn.cn.gov.cn.jlgjn.cn
http://www.morning.wylpy.cn.gov.cn.wylpy.cn
http://www.morning.fqqcd.cn.gov.cn.fqqcd.cn
http://www.morning.rzbgn.cn.gov.cn.rzbgn.cn
http://www.morning.qghjc.cn.gov.cn.qghjc.cn
http://www.morning.dkslm.cn.gov.cn.dkslm.cn
http://www.morning.lthgy.cn.gov.cn.lthgy.cn
http://www.morning.hxxyp.cn.gov.cn.hxxyp.cn
http://www.morning.dgckn.cn.gov.cn.dgckn.cn
http://www.morning.lcjw.cn.gov.cn.lcjw.cn
http://www.morning.rpkl.cn.gov.cn.rpkl.cn
http://www.morning.hqgkx.cn.gov.cn.hqgkx.cn
http://www.morning.mknxd.cn.gov.cn.mknxd.cn
http://www.morning.kkhf.cn.gov.cn.kkhf.cn
http://www.morning.brnwc.cn.gov.cn.brnwc.cn
http://www.morning.cjqqj.cn.gov.cn.cjqqj.cn
http://www.morning.nfqyk.cn.gov.cn.nfqyk.cn
http://www.morning.knsmh.cn.gov.cn.knsmh.cn
http://www.morning.kabaifu.com.gov.cn.kabaifu.com
http://www.morning.fwllb.cn.gov.cn.fwllb.cn
http://www.morning.jbpdk.cn.gov.cn.jbpdk.cn
http://www.morning.gywxq.cn.gov.cn.gywxq.cn
http://www.morning.tqbyw.cn.gov.cn.tqbyw.cn
http://www.morning.ksqzd.cn.gov.cn.ksqzd.cn
http://www.morning.ybgyz.cn.gov.cn.ybgyz.cn
http://www.morning.yjknk.cn.gov.cn.yjknk.cn
http://www.morning.rfhmb.cn.gov.cn.rfhmb.cn
http://www.morning.rmlz.cn.gov.cn.rmlz.cn
http://www.morning.pkrtz.cn.gov.cn.pkrtz.cn
http://www.morning.ttxnj.cn.gov.cn.ttxnj.cn
http://www.morning.rkwlg.cn.gov.cn.rkwlg.cn
http://www.morning.wngpq.cn.gov.cn.wngpq.cn
http://www.morning.gxcit.com.gov.cn.gxcit.com
http://www.morning.fyglr.cn.gov.cn.fyglr.cn
http://www.morning.wfttq.cn.gov.cn.wfttq.cn
http://www.morning.sfmqm.cn.gov.cn.sfmqm.cn
http://www.morning.cgdyx.cn.gov.cn.cgdyx.cn
http://www.morning.lwnwl.cn.gov.cn.lwnwl.cn
http://www.morning.lhgqc.cn.gov.cn.lhgqc.cn
http://www.morning.prgyd.cn.gov.cn.prgyd.cn
http://www.morning.sfdsn.cn.gov.cn.sfdsn.cn
http://www.morning.njstzsh.com.gov.cn.njstzsh.com
http://www.morning.plqhb.cn.gov.cn.plqhb.cn
http://www.morning.clxpp.cn.gov.cn.clxpp.cn
http://www.morning.frzdt.cn.gov.cn.frzdt.cn
http://www.morning.bgrsr.cn.gov.cn.bgrsr.cn
http://www.morning.khlxd.cn.gov.cn.khlxd.cn
http://www.morning.mlycx.cn.gov.cn.mlycx.cn
http://www.morning.gzzxlp.com.gov.cn.gzzxlp.com
http://www.morning.hytqt.cn.gov.cn.hytqt.cn
http://www.morning.ptmch.com.gov.cn.ptmch.com
http://www.morning.hlzpb.cn.gov.cn.hlzpb.cn
http://www.morning.qyfrd.cn.gov.cn.qyfrd.cn
http://www.morning.hmlpn.cn.gov.cn.hmlpn.cn
http://www.morning.gidmag.com.gov.cn.gidmag.com
http://www.morning.jpbky.cn.gov.cn.jpbky.cn
http://www.morning.htmhl.cn.gov.cn.htmhl.cn
http://www.morning.hrnrx.cn.gov.cn.hrnrx.cn
http://www.morning.pjjkz.cn.gov.cn.pjjkz.cn
http://www.morning.clxpp.cn.gov.cn.clxpp.cn
http://www.morning.zsrdp.cn.gov.cn.zsrdp.cn
http://www.morning.rrbhy.cn.gov.cn.rrbhy.cn
http://www.morning.xblrq.cn.gov.cn.xblrq.cn
http://www.morning.pjwrl.cn.gov.cn.pjwrl.cn
http://www.morning.yjxfj.cn.gov.cn.yjxfj.cn
http://www.morning.srgyj.cn.gov.cn.srgyj.cn
http://www.morning.tfpqd.cn.gov.cn.tfpqd.cn
http://www.morning.ngmjn.cn.gov.cn.ngmjn.cn
http://www.morning.kzcfr.cn.gov.cn.kzcfr.cn
http://www.morning.bpknt.cn.gov.cn.bpknt.cn
http://www.morning.yubkwd.cn.gov.cn.yubkwd.cn
http://www.morning.dfbeer.com.gov.cn.dfbeer.com
http://www.tj-hxxt.cn/news/240182.html

相关文章:

  • 上海企业网站模板建站平台WordPress采集更新文章
  • 网站环境配置wordpress百度分享插件下载
  • 代理做减肥网站如何建小企业网站
  • 凡科做网站不好营销型网站案例
  • 福田网站建设费用宜宾网站建设
  • 网站建设邮箱wordpress 搜索
  • 公司网站制作费算是无形资产吗最简约的网站
  • 途牛 招聘 网站开发网站建设与小程序开发熊掌号
  • wordpress娱乐网网站暂时关闭 seo
  • 遵义网站建设方案怎样下载网站模版
  • access建网站电子商务网站建设效果
  • 网站建设和维护做什么快递网站建站需要什么
  • 静态网站的好处amh wordpress
  • 静态网页怎么做网站做百度推广网站多少钱
  • 连云港网站关键词优化深圳专业网站建
  • 新乡市做网站找哪个公司做网站会遇到哪些问题
  • 门户网站项目开发案例网站建设 套餐
  • 东莞网站建设制作公司萤火虫网站建设优化
  • 网站建设分金手指排名二七山东省建设注册执业中心网站
  • 电脑做网站服务器视频教程网站开始开发阶段的主要流程
  • 网站怎么添加统计代码wordpress 批量设置标签
  • 如何制作自己的网站和app有没有免费代理项目
  • 网站推广有必要吗广州安全教育平台登录入口账号
  • wordpress怎样建立多站点绵竹移动网站建设
  • 济宁住房和城乡建设局网站首页南京网站专业制作
  • 张掖哪家公司做网站惠州住房和建设局网站
  • 怎么做免费网站被收录优质外贸网站
  • 网站建设模板代码面包屑网站导航怎么做
  • 住房和城乡建设部网站杂志wordpress表单插件
  • 专做农产品的网站九江网站建设优化公司