当前位置: 首页 > news >正文

设计师做单页的网站seo网络推广知识

设计师做单页的网站,seo网络推广知识,供热设施网站搭建教程,可以做语文阅读题的网站文章目录 前期准备探索该网页的HTML码的特点开始编写代码存入文件总的程序文件存储效果 前期准备 随便找个网站进行爬取,这里我选择的是(一个卖书的网站) https://www.bookschina.com/24hour/62700000/ 我的目的是爬取这个网站的这个页面的书籍的名称以…

在这里插入图片描述

文章目录

  • 前期准备
  • 探索该网页的HTML码的特点
  • 开始编写代码
  • 存入文件
  • 总的程序
  • 文件存储效果

前期准备

随便找个网站进行爬取,这里我选择的是(一个卖书的网站)
https://www.bookschina.com/24hour/62700000/
在这里插入图片描述

我的目的是爬取这个网站的这个页面的书籍的名称以及相对应的价格

探索该网页的HTML码的特点

在该网页右键,选择检查,就可以看到下面的样子
在这里插入图片描述
然后按下面图片的第一个按键(作用是:当你鼠标停留在网页时,会自动显示到对应的网页代码)
在这里插入图片描述

查找书名的特点

在这里插入图片描述
在这里插入图片描述

我们发现,书名是位于<h2 class = "name" >标签的 <a >标签里面的

在这里插入图片描述

同理,可以找到价格是位于<div class = "priceWrap" 里面的<span class = "swllPrice>标签里面的 "

那么这么就好办了

开始编写代码

import requests
from bs4 import BeautifulSoup# 设置请求头,模拟浏览器访问
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}# 发送GET请求获取页面内容
response = requests.get(r'https://www.bookschina.com/24hour/62700000/', headers=headers)# 打印HTTP响应状态码
print(response.status_code)# 获取页面内容
content = response.text# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(content, "html.parser")# 存储书名的列表
namestore = []# 存储价格的列表
pricestore = []# 查找所有class为"name"的h2标签
allname = soup.findAll("h2", attrs={"class": "name"})# 遍历每个h2标签
for name in allname:# 在每个h2标签中查找所有的a标签realnames = name.findAll("a")# 遍历每个a标签for realname in realnames:# 将书名添加到namestore列表中namestore.append(realname.string)# 查找所有class为"priceWrap"的div标签
allprice = soup.findAll("div", attrs={"class": "priceWrap"})# 遍历每个div标签
for price in allprice:# 在每个div标签中查找所有class为"sellPrice"的span标签realprices = price.findAll("span", attrs={"class": "sellPrice"})# 遍历每个span标签for realprice in realprices:# 将价格添加到pricestore列表中pricestore.append(realprice.string)# 使用zip函数将书名和价格对应起来,并打印结果
for a, b in zip(namestore, pricestore):print(a, b)

存入文件

# 打开文件,准备写入数据,使用UTF-8编码
with open(r"d:\Desktop\畅销书以及价格.txt", "w", encoding='utf-8') as f:# 使用zip函数将书名和价格对应起来,并写入文件for a, b in zip(namestore, pricestore):# 写入书名f.write(str(a) + '\n')# 写入价格f.write(str(b) + '\n')

总的程序

import requests
from bs4 import BeautifulSoupheaders ={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}responce = requests.get(r'https://www.bookschina.com/24hour/62700000/',headers = headers)print(responce.status_code)
content = responce.text
soup = BeautifulSoup(content,"html.parser")namestore = []
pricestore = []allname = soup.findAll("h2",attrs={"class" : "name"})
for name in allname:realnames = name.findAll("a")for realname in realnames:#print(realname.string)namestore.append(realname.string)allprice = soup.findAll("div",attrs={"class":"priceWrap"})
for price in allprice:realprices = price.findAll("span",attrs={"class" : "sellPrice"})for realprice in realprices:#print(realprice.string)pricestore.append(realprice.string)with open(r"d:\Desktop\畅销书以及价格.txt","w",encoding='utf-8') as f:for a, b in zip(namestore, pricestore):f.writelines(str(a) + '\n' )f.writelines(str(b) + '\n' )

文件存储效果

在这里插入图片描述

http://www.tj-hxxt.cn/news/59466.html

相关文章:

  • 网站排名如何做免费舆情网站下载大全最新版
  • 利用大平台做网站外贸网站推广软件
  • 东莞高埗做网站哪个公司好网络营销教学网站
  • 企业网站建设原则seo推广沧州公司电话
  • 聊城网站优化网络推广seo整站优化方案案例
  • 淘宝优惠券微网站开发知名网页设计公司
  • wordpress导入lofter北京百度seo排名点击软件
  • 东莞厚街做网站软文范文200字
  • 网站规划与设计就业百度推广软件
  • wordpress 运费设置seo整站优化哪家专业
  • 珠海北京网站建设百度快速收录
  • 惠阳网站制作公司国外搜索引擎有哪些
  • 域名哪个网站买最好搜索app下载安装
  • 建设工程的招标网站有哪些网络营销平台有哪些
  • wordpress商城案例seo优化技术排名
  • java做网站的步骤社交媒体营销策略有哪些
  • wordpress 菜单去掉链接百度优化怎么做
  • 地方网站用什么域名天津百度爱采购
  • wordpress 邮箱订阅上海高端seo公司
  • 关于做奶妈的视频网站淘宝关键词搜索排名
  • 重庆建设工程信息网网搜索引擎优化是做什么的
  • 巩义网站建设案例网站制作维护
  • 门户网站目标客户免费推广网站排行榜
  • 个人门户网站备案杭州网站排名提升
  • 网站服务器有问题怎么办啊优化方案的格式及范文
  • 芜湖代理公司注册seo营销软件
  • 志愿者网站时长码怎么做软文新闻发布网站
  • wordpress 后台 主题太原seo推广
  • 网站名怎么写百度网站搜索排名
  • 我想做网站怎么做昆山推广营销大的公司