当前位置: 首页 > news >正文

高并发电商网站开发我要看今日头条

高并发电商网站开发,我要看今日头条,做电影网站的程序,厦门哪些企业做视频网站的SparkSQL和Hive语法差异 1、仅支持Hive SparkSQL关联条件on不支持函数rand()创建零时表时,Spark不支持直接赋值nullSpark无法读取字段类型为void的表SparkSQL中如果表达式没有指定别名,SparkSQL会将整个表达式作为别名,如果表达式中包含特殊…

SparkSQL和Hive语法差异

1、仅支持Hive

  1. SparkSQL关联条件on不支持函数rand()
  2. 创建零时表时,Spark不支持直接赋值null
  3. Spark无法读取字段类型为void的表
  4. SparkSQL中如果表达式没有指定别名,SparkSQL会将整个表达式作为别名,如果表达式中包含特殊字符(如逗号)。则CTAS建表会失败

2、仅支持SparkSQL

SparkSQL允许在join on条件中使用or等不等式值关联语句,Hive中不允许,只能用等值关联

3、相同函数差异

  1. Spark运行时用到的hash函数,与hive的哈希算法不同,如果使用hash(),结果和hive的hash()会有差异
  2. Hive和sparkSQL使用grouping sets生成的grouping_id不一致
  3. regexp_extract未匹配上的话,hive里回的是null,但是在spark里返回的是空字符
  4. sparkSQL中的row_number的over中不能省略sort by 或order by
  5. grouping_id()函数生成的数据不同
  6. reflect()函数中,如果入参有非法数据或者null,hive会返回null,而spark会抛出异常

创建DataFrame

Row 类型 表示一行数据

  • datafram就算是多行构成
# Row行数据操作
# 导入行类
from pyspark.sql import Row定义每行数据 有两种获取方法=重点
r1 = Row(id=1,name='张三')
r2 = Row(id=2,name='李四')
# 操作每行数据
# 获取对应字段数据
print(r1.id)
print(r1.name)
print(r2['id'])
print(r2['name'])定义行数据不指定字段 = 只有一种获取方法
r3 = Row(3,'王五')
print(r3[1])df.printSchema()

schema表信息(这种指定表信息的更不常用

  • 定义dataframe中的表的字段名和字段类型
# 导入数据类型
from pyspark.sql.types import *
# 定义schema信息
# 使用StructType类进行定义
# add()方法是指定字段信息
# 第一参数,字段名
# 第二个参数,字段信息
# 第三个参数是否允许为空值  默认是True,允许为空
schema_type = StructType().\add('id',IntegerType()).\add('name',StringType()).\add('age',IntegerType(),False)df.printSchema()
# 导入行类Row
from pyspark.sql import SparkSession, Row
from pyspark.sql.types import *# 创建行数据
r1 = Row(id=1, name='张三', age=20)
r2 = Row(id=2, name='李四', age=22)
# 创建元数据
schema = StructType(). \add('id', IntegerType()). \add('name', StringType()). \add('age', IntegerType())# 创建dataframe
# 生成sparksession对象  按照固定写法创建
ss = SparkSession.builder.getOrCreate()
# 使用sparksession对象方法创建df
# createDataFrame 第一参数是一个列表数据,将每行数据放入列表
# 第二个参数指定表元数据信息
# df是一个dataframe类型的对象
df = ss.createDataFrame([r1, r2], schema=schema)# dataframe数据的操作
# 查看df数据
df.show()  # 查看所有数据,超过20行时,默认只显示20行
# 查看元信息
df.printSchema()
http://www.tj-hxxt.cn/news/22855.html

相关文章:

  • 好域名做网站河源今日头条新闻最新
  • 海口网站如何制作互联网推广渠道
  • 惠州禅城网站建设域名服务器ip查询网站
  • 做dj选歌是哪个网站网站建设山东聚搜网络
  • 百度开放云做网站举例一个成功的网络营销案例
  • 汕头有建网站公司吗googleseo推广
  • 网站抽奖模板手机推广平台有哪些
  • 长沙网上商城北京seo优化厂家
  • hbuilder开发安卓appseo推广绩效考核指标是什么
  • 做渐变色的网站百度竞价排名软件
  • 质监站网址百度服务中心投诉
  • 网站做rss wordpress百度指数行业排行
  • 刚做的网站适合做外链吗广告公司营销策划方案
  • 宁德公司做网站潍坊seo建站
  • 深圳的网站建设公司seo运营人士揭秘
  • 可以做围棋题的网站网址收录
  • 哪些网站可以做百科来源seo白帽优化
  • 营销网站建设解决方案seo网站诊断报告
  • seo优化一般包括哪些内容()。泰州网站整站优化
  • 达日县网站建设公司百度搜索网站排名
  • 广州新型冠状病毒最新消息南京seo招聘
  • 企业核名网站武汉网站seo公司
  • 淘宝网站推广策划方案西安网站建设比较好的公司
  • 杭州维利国德网站建设案例网络营销比较成功的企业
  • 房地产首页设计seo优化排名易下拉效率
  • 陕西的建设厅官方网站专业seo推广
  • 网站设计内容包括舆情网站直接打开怎么弄
  • wordpress 电脑测试百度词条优化
  • 做一个二手网站怎么做三十个知识点带你学党章
  • 如何制作网站视频的软件什么是网络营销战略