当前位置: 首页 > news >正文

临沂网站临沂网站制作强强seo博客

临沂网站临沂网站制作,强强seo博客,qq网页登录入口,寮步营销型网站建设文章目录 一、爬虫对象-豆瓣读书TOP250二、python爬虫代码讲解三、讲解视频四、完整源码 一、爬虫对象-豆瓣读书TOP250 您好,我是 马哥python说 ,一名10年程序猿。 今天我们分享一期python爬虫案例讲解。爬取对象是,豆瓣读书TOP250排行榜数…

文章目录

  • 一、爬虫对象-豆瓣读书TOP250
  • 二、python爬虫代码讲解
  • 三、讲解视频
  • 四、完整源码

一、爬虫对象-豆瓣读书TOP250

您好,我是 @马哥python说 ,一名10年程序猿。

今天我们分享一期python爬虫案例讲解。爬取对象是,豆瓣读书TOP250排行榜数据:
https://book.douban.com/top250豆瓣读书250页面

开发好python爬虫代码后,爬取成功后的csv数据,如下:
部分爬取结果

代码是怎样实现的爬取呢?下面逐一讲解python实现。

二、python爬虫代码讲解

首先,导入需要用到的库:

import requests  # 发送请求
from bs4 import BeautifulSoup  # 解析网页
import pandas as pd  # 存取csv
from time import sleep  # 等待时间

然后,向豆瓣读书网页发送请求:

res = requests.get(url, headers=headers)

利用BeautifulSoup库解析响应页面:

soup = BeautifulSoup(res.text, 'html.parser')

用BeautifulSoup的select函数,(css解析的方法)编写代码逻辑,部分核心代码:

name = book.select('.pl2 a')[0]['title']  # 书名
book_name.append(name)
bkurl = book.select('.pl2 a')[0]['href']  # 书籍链接
book_url.append(bkurl)
star = book.select('.rating_nums')[0].text  # 书籍评分
book_star.append(star)
star_people = book.select('.pl')[1].text  # 评分人数
star_people = star_people.strip().replace(' ', '').replace('人评价', '').replace('(\n', '').replace('\n)','')  # 数据清洗
book_star_people.append(star_people)

最后,将爬取到的数据保存到csv文件中:

def save_to_csv(csv_name):"""数据保存到csv:return: None"""df = pd.DataFrame()  # 初始化一个DataFrame对象df['书名'] = book_namedf['豆瓣链接'] = book_urldf['作者'] = book_authordf['译者'] = book_translaterdf['出版社'] = book_publisherdf['出版日期'] = book_pub_yeardf['价格'] = book_pricedf['评分'] = book_stardf['评分人数'] = book_star_peopledf['一句话评价'] = book_commentdf.to_csv(csv_name, encoding='utf8')  # 将数据保存到csv文件

其中,把各个list赋值为DataFrame的各个列,就把list数据转换为了DataFrame数据,然后直接to_csv保存。

这样,爬取的数据就持久化保存下来了。

三、讲解视频

同步讲解视频:【python爬虫案例】利用python爬虫爬取豆瓣读书TOP250的数据!

四、完整源码

附完整源代码:【python爬虫案例】利用python爬虫爬取豆瓣读书TOP250的数据!


我是 @马哥python说 ,持续分享python源码干货中!

http://www.tj-hxxt.cn/news/45557.html

相关文章:

  • ru后缀的网站求职seo服务
  • 地方政府网站建设中存在的问题网址之家大全
  • 做纺织的用什么网站推广赚钱app哪个靠谱
  • 陕西省建设网站 五大员过期网站设计的基本原则
  • 有没有免费b2b平台济南公司网站推广优化最大的
  • 智慧团建网站登录入口电脑版武汉百度开户电话
  • 怎么做一考试网站青岛网站建设维护
  • 怎样用西瓜影音做网站网站运营推广方式
  • 优秀的网页设计图片甘肃seo网站
  • 网站开发+进度表广告网络推广
  • 模拟购物网站开发项目无锡网站制作
  • 设计机构网站做网站的外包公司
  • 开个做网站的公司 知乎sem营销推广
  • 东莞长安营销型网站建设网站怎么优化到首页
  • 网站规划与建设 ppt网站收录是什么意思
  • 做网站代理商好赚吗?网址导航大全
  • 网页设计代码单元格内容怎么居中赣州seo唐三
  • 信誉好的顺德网站建设南宁百度seo建议
  • 做后期的网站每日精选12条新闻
  • 做网站要什么资料网站免费推广的方法
  • 常见的cms网站程序有哪些提高工作效率的方法
  • 鹿城区住房和城乡建设局网站群发软件
  • 企业网站建设能用labview吗优化水平
  • wordpress不能登录界面百度seo关键词工具
  • 网站建设规划书道客巴巴网络推广业务
  • wap网站在线生成个人可以做推广的平台有哪些
  • 网站的设计思路范文查排名官网
  • 桂林生活网分类信息网站如何创建网站站点
  • 同学录网站开发实现基本要求seo关键词优化案例
  • 建材做网站好吗网页代码模板