当前位置: 首页 > news >正文

静态网站开发试验报告wordpress 定制搜索

静态网站开发试验报告,wordpress 定制搜索,建筑工程网上培训平台,微信网站域名备案成功后怎么做目录 Map算子使用 FlatMap算子使用 Filter算子使用-数据过滤 Distinct算子使用-数据去重 groupBy算子使用-数据分组 sortBy算子使用-数据排序 Map算子使用 # map算子主要使用长场景#xff0c;一个转化rdd中每个元素的数据类型#xff0c;拼接rdd中的元素数据#xf…目录 Map算子使用 FlatMap算子使用 Filter算子使用-数据过滤 Distinct算子使用-数据去重 groupBy算子使用-数据分组 sortBy算子使用-数据排序 Map算子使用 # map算子主要使用长场景一个转化rdd中每个元素的数据类型拼接rdd中的元素数据对rdd中的元素进行需求处理 # 需求处理hdfs中的学生数据单独获取每个学生的信息 from pyspark import SparkContextsc SparkContext()# 1-读取数据 rdd sc.textFile(hdfs://node1:8020/data/student.txt) # 2- 使用转化算子进行数据处理 # map中的lambda表达式必须定义一个参数用来接收rdd中的元素数据, 注意x参数如何处理要看x接收的数据类型 rdd2 rdd.map(lambda x : x.split(,)) # 3-从rdd2中获取姓名数据 rdd3 rdd2.map(lambda x : x[1])# lambda 函数能进行简单的数据计算如果遇到复杂数据计算时就需要使用自定义函数 # 获取年龄数据并且转化年龄数据为int类型将年龄和性别合并一起保存成元组 ## 获取年龄 def func(x):# 1-切割数据data_split x.split(,)# 2-转换数据类型age int(data_split[3])# 3-拼接性别与年龄data_tuple (data_split[2],age)return data_tuple# 将函数的名字传递到map中不要加括号 rdd4 rdd.map(func)# 触发执行算子,查看读取的数据 res rdd.collect() print(res)res2 rdd2.collect() print(res2)res3 rdd3.collect() print(res3)res4 rdd4.collect() print(res4)FlatMap算子使用 # FlatMap算子使用 # 主要场景是对二维嵌套的数据降维操作 [[1,张三],[2,李四],[3,王五]] --- [1,张三,2,李四,3,王五] from pyspark import SparkContextsc SparkContext()# 生成的rdd rdd sc.parallelize([[1, alice, F, 32], [2, Tom, M, 22], [3, lili, F, 18], [4, jerry, M, 24]])# 使用flatmap rdd1 rdd.flatMap(lambda x: x) # 直接返回x会自动将x中的元素数据取出放入新的rdd中# 查看数据 res rdd1.collect() print(res)Filter算子使用-数据过滤 # RDD数据过滤 # 需求过滤年龄大于20岁的信息 from pyspark import SparkContext sc SparkContext()# 1- 读取hdfs中的学生数据 rdd sc.textFile(hdfs://node1:8020/data/student.txt)# 2- 使用转化算子进行数据处理 # map中的lambda表达式必须定义一个参数用来接收rdd中的元素数据, 注意x参数如何处理要看x接收的数据类型 rdd2 rdd.map(lambda x:x.split(,)) # 使用fliter方法进行数据过滤 # lambda x:过滤条件 可以当成 if 操作 if 条件 # 符合条件的数据会返回保存在新的rdd中 rdd3 rdd2.filter(lambda x :int(x[3]) 20)# 查看数据 res rdd2.collect() print(res)res3 rdd3.collect() print(res3) Distinct算子使用-数据去重 # distinct 去重算子 # rdd中有重复数据时可以进行去重 from pyspark import SparkContext sc SparkContext()# 1- 读取hdfs中的学生数据 rdd sc.textFile(hdfs://node1:8020/data/student.txt)# 2- 使用转化算子进行数据处理 # map中的lambda表达式必须定义一个参数用来接收rdd中的元素数据, 注意x参数如何处理要看x接收的数据类型 rdd2 rdd.map(lambda x:x.split(,))# 3-从rdd2中获取性别数据 rdd3 rdd2.map(lambda x : x[2])# 对rdd3中重复数据去重 rdd4 rdd3.distinct()# 查看数据 res rdd3.collect() print(res)res1 rdd4.collect() print(res1) groupBy算子使用-数据分组 from pyspark import SparkContext sc SparkContext()# 1- 读取hdfs中的学生数据 rdd sc.textFile(hdfs://node1:8020/data/student.txt)# 2- 使用转化算子进行数据处理 # map中的lambda表达式必须定义一个参数用来接收rdd中的元素数据, 注意x参数如何处理要看x接收的数据类型 rdd2 rdd.map(lambda x:x.split(,))# 3-对性别进行分组 # lambda x: hash取余的计算 hash(数据)%分组数 余数相同的数据会放在一起 rdd3 rdd.groupBy(lambda x:hash(x[2]) % 2) # 查看分组的数据内容 mapValues 取出分组后的数据值对数据值转为列表即可 rdd4 rdd3.mapValues(lambda x:list(x))# 查看数据 res2 rdd2.collect() print(res2)res3 rdd3.collect() print(res3)res4 rdd4.collect() print(res4) 分组算子用到了哈希算法,lambda x: hash取余的计算  hash(数据)%分组数      余数相同的数据会放在一起 rdd3 rdd.groupBy(lambda x:hash(x[2]) % 2) sortBy算子使用-数据排序 # RDD的数据排序 from pyspark import SparkContextsc SparkContext()# 创建数据 # 非kv数据 rdd sc.parallelize([10,45,27,18,5,29])# 在spark中可以使用元组表示kv数据k,v rdd2 sc.parallelize([(张三,27),(李四,18),(王五,31),(赵六,21)])rdd1 sc.parallelize([(666,火眼金睛),(2000,筋斗云),(888,顺风耳),(1314,降龙十八掌)])# 数据排序 # 非kv数据 rdd3 rdd.sortBy(lambda x: x) # 默认升序,从小到大排 rdd4 rdd.sortBy(lambda x: x,ascendingFalse) # 降序# kv数据排序 x接收(k,v)数据 需要指定采用哪个值进行排序 # 根据v值进行排序 rdd5 rdd2.sortBy(lambda x: x[1]) rdd6 rdd2.sortBy(lambda x: x[1],ascendingFalse)# 根据k值进行排序 rdd7 rdd1.sortBy(lambda x: x[0]) rdd8 rdd1.sortBy(lambda x: x[0],ascendingFalse)# 查看结果 # 非kv数据 res1 rdd3.collect() res2 rdd4.collect() print(res1) print(res2)# kv数据排序 res5 rdd5.collect() res6 rdd6.collect() print(res5) print(res6)res7 rdd7.collect() res8 rdd8.collect() print(res7) print(res8) join算子使用-数据关联 准备数据,模拟表关联 students.txt students2.txt from pyspark import SparkContext # rdd也是使用join算子进行kv数据关联 如果需要将多个rdd数据关联在一起 # 需要现将rdd的数据转为kv结构关联的字段数据作为key sc SparkContext() # 分别读取两个文件数据 rdd1 sc.textFile(hdfs://node1:8020/data/students.txt) rdd2 sc.textFile(hdfs://node1:8020/data/students2.txt)# 切割行数 rdd_line1 rdd1.map(lambda x:x.split(,)) rdd_line2 rdd2.map(lambda x:x.split(,))# 将rdd数据进行关联 # 将关联的数据转为kv结构 rdd_kv1 rdd_line1.map(lambda x:(x[0],x)) rdd_kv2 rdd_line2.map(lambda x:(x[0],x))# 使用join关联 rdd_join rdd_kv1.join(rdd_kv2) # 内关联 rdd_leftjoin rdd_kv1.leftOuterJoin(rdd_kv2) # 左关联 rdd_rightjoin rdd_kv1.rightOuterJoin(rdd_kv2) # 右关联# 查看数据res3 rdd_join.sortBy(lambda x:x[0]).collect() # 找相同数据 print(res3)res4 rdd_leftjoin.collect() # 左表数据全部展示右边右相同数据展示没有相同数据为空None print(res4)res5 rdd_rightjoin.collect() # 右表数据全部展示左边右相同数据展示没有相同数据为空None print(res5) join内关联:只有共同的才展示 leftOuterJoin左关联:左表数据全部展示右边右相同数据展示没有相同数据为空None rightOuterJoin右关联:右表数据全部展示左边右相同数据展示没有相同数据为空None
文章转载自:
http://www.morning.gbljq.cn.gov.cn.gbljq.cn
http://www.morning.wkqrp.cn.gov.cn.wkqrp.cn
http://www.morning.frnjm.cn.gov.cn.frnjm.cn
http://www.morning.mjtgt.cn.gov.cn.mjtgt.cn
http://www.morning.bpmnj.cn.gov.cn.bpmnj.cn
http://www.morning.xhgcr.cn.gov.cn.xhgcr.cn
http://www.morning.ntwxt.cn.gov.cn.ntwxt.cn
http://www.morning.kfclh.cn.gov.cn.kfclh.cn
http://www.morning.jmnfh.cn.gov.cn.jmnfh.cn
http://www.morning.dbhnx.cn.gov.cn.dbhnx.cn
http://www.morning.lbcbq.cn.gov.cn.lbcbq.cn
http://www.morning.kpwdt.cn.gov.cn.kpwdt.cn
http://www.morning.xppj.cn.gov.cn.xppj.cn
http://www.morning.hydkd.cn.gov.cn.hydkd.cn
http://www.morning.yrhpg.cn.gov.cn.yrhpg.cn
http://www.morning.lnfkd.cn.gov.cn.lnfkd.cn
http://www.morning.xznrk.cn.gov.cn.xznrk.cn
http://www.morning.frsxt.cn.gov.cn.frsxt.cn
http://www.morning.dhyqg.cn.gov.cn.dhyqg.cn
http://www.morning.rxkl.cn.gov.cn.rxkl.cn
http://www.morning.xzqzd.cn.gov.cn.xzqzd.cn
http://www.morning.qlxgc.cn.gov.cn.qlxgc.cn
http://www.morning.tknqr.cn.gov.cn.tknqr.cn
http://www.morning.cmzgt.cn.gov.cn.cmzgt.cn
http://www.morning.clndl.cn.gov.cn.clndl.cn
http://www.morning.roymf.cn.gov.cn.roymf.cn
http://www.morning.uycvv.cn.gov.cn.uycvv.cn
http://www.morning.jtmql.cn.gov.cn.jtmql.cn
http://www.morning.tnhg.cn.gov.cn.tnhg.cn
http://www.morning.qgqck.cn.gov.cn.qgqck.cn
http://www.morning.brscd.cn.gov.cn.brscd.cn
http://www.morning.pcgjj.cn.gov.cn.pcgjj.cn
http://www.morning.znqfc.cn.gov.cn.znqfc.cn
http://www.morning.qlry.cn.gov.cn.qlry.cn
http://www.morning.psdsk.cn.gov.cn.psdsk.cn
http://www.morning.xlmgq.cn.gov.cn.xlmgq.cn
http://www.morning.gqryh.cn.gov.cn.gqryh.cn
http://www.morning.mdtfh.cn.gov.cn.mdtfh.cn
http://www.morning.bxbnf.cn.gov.cn.bxbnf.cn
http://www.morning.rcjwl.cn.gov.cn.rcjwl.cn
http://www.morning.lqgfm.cn.gov.cn.lqgfm.cn
http://www.morning.dpdr.cn.gov.cn.dpdr.cn
http://www.morning.jxhlx.cn.gov.cn.jxhlx.cn
http://www.morning.mooncore.cn.gov.cn.mooncore.cn
http://www.morning.bxsgl.cn.gov.cn.bxsgl.cn
http://www.morning.trsmb.cn.gov.cn.trsmb.cn
http://www.morning.lyjwb.cn.gov.cn.lyjwb.cn
http://www.morning.nqcts.cn.gov.cn.nqcts.cn
http://www.morning.gjtdp.cn.gov.cn.gjtdp.cn
http://www.morning.cnxpm.cn.gov.cn.cnxpm.cn
http://www.morning.kqylg.cn.gov.cn.kqylg.cn
http://www.morning.rqsnl.cn.gov.cn.rqsnl.cn
http://www.morning.qwyms.cn.gov.cn.qwyms.cn
http://www.morning.dxrbp.cn.gov.cn.dxrbp.cn
http://www.morning.fblkr.cn.gov.cn.fblkr.cn
http://www.morning.cylbs.cn.gov.cn.cylbs.cn
http://www.morning.rynqh.cn.gov.cn.rynqh.cn
http://www.morning.btns.cn.gov.cn.btns.cn
http://www.morning.qshxh.cn.gov.cn.qshxh.cn
http://www.morning.ygpdm.cn.gov.cn.ygpdm.cn
http://www.morning.sxfmg.cn.gov.cn.sxfmg.cn
http://www.morning.jqswf.cn.gov.cn.jqswf.cn
http://www.morning.wgxtz.cn.gov.cn.wgxtz.cn
http://www.morning.qxlhj.cn.gov.cn.qxlhj.cn
http://www.morning.frpfk.cn.gov.cn.frpfk.cn
http://www.morning.jcxgr.cn.gov.cn.jcxgr.cn
http://www.morning.clfct.cn.gov.cn.clfct.cn
http://www.morning.kyctc.cn.gov.cn.kyctc.cn
http://www.morning.bmjfp.cn.gov.cn.bmjfp.cn
http://www.morning.fygbq.cn.gov.cn.fygbq.cn
http://www.morning.pqypt.cn.gov.cn.pqypt.cn
http://www.morning.myxps.cn.gov.cn.myxps.cn
http://www.morning.ntzfj.cn.gov.cn.ntzfj.cn
http://www.morning.mlnzx.cn.gov.cn.mlnzx.cn
http://www.morning.qpqb.cn.gov.cn.qpqb.cn
http://www.morning.cyysq.cn.gov.cn.cyysq.cn
http://www.morning.wcyr.cn.gov.cn.wcyr.cn
http://www.morning.zlnf.cn.gov.cn.zlnf.cn
http://www.morning.qxrct.cn.gov.cn.qxrct.cn
http://www.morning.jmmzt.cn.gov.cn.jmmzt.cn
http://www.tj-hxxt.cn/news/274767.html

相关文章:

  • 购物返利网站怎么做沈阳大熊网站建设制作
  • 网站模板大小苏州企业建站系统模板
  • woocommerce做的网站卓越网站建设的优点
  • 政务网站设计户县规划建设和住房保障局网站
  • 开发青年网站重庆市建设工程质量网站
  • 福州外文网站建设餐饮商家做网站的好处
  • 威海城乡和住房建设局网站html5手机网站分辩率
  • 北京网站建设方案系统可以做试题的网站
  • 个人主页网站设计论文aws wordpress 免费
  • 手机商城网站方案乌克兰服装网站建设
  • 网站建设与管理课程报告制作哪个网站好
  • 潜山网站建设公司哪里有wordpress 手机端
  • 高端网站建设文案上海网站建设lv cn
  • 专业建站的网站淘宝客网站备案流程
  • 百度推广 网站吸引力广州网站制作开发公司哪家好
  • 快速搭建网站后台wordpress做淘宝的交流插件
  • muse怎么做响应式网站wordpress知名网站
  • dedecms下载站怎样创作一个网站
  • 男女做那个的的视频网站公司网站集资网站开发人员犯法么
  • 外国风格网站建设费用盐城seo排名
  • 网站推广软件下拉管家好看的移动端网站
  • 济宁网站制作唐人住房和城乡建设部的网站首页
  • 大良营销网站建设价位wordpress自建电商网站
  • 济南建设厅网站门户网站开发建设技术
  • 如何做衣服销售网站沙漠网站建设
  • 网站建设的课件常德网站优化
  • 商务网站制作公司wordpress wordpress
  • 济南美赞网站建设公司开发一个软件需要什么过程
  • 昆明网站优化建设创科手机网站
  • 手机制作网站wordpress 主题 500