当前位置: 首页 > news >正文

b2c商城网站建设百度seo查询工具

b2c商城网站建设,百度seo查询工具,ImQQ网站是怎么做的,网站上的产品板块python爬虫入门(实践) 一、对目标网站进行分析 二、博客爬取 获取博客所有h2标题的路由 确定目标,查看源码 代码实现 """ 获取博客所有h2标题的路由 """url "http://www.crazyant.net"import re…

python爬虫入门(实践)

一、对目标网站进行分析

在这里插入图片描述
在这里插入图片描述

二、博客爬取

  1. 获取博客所有h2标题的路由

    1. 确定目标,查看源码
      在这里插入图片描述

    2. 代码实现

      """
      获取博客所有h2标题的路由
      """url = "http://www.crazyant.net"import requests
      from bs4 import BeautifulSoup#发送请求,获取页面所有内容
      r = requests.get(url)
      if r.status_code != 200:raise Exception("请求失败") # 抛出异常
      html_doc = r.text# 解析html,获取对应信息
      soup = BeautifulSoup(html_doc,"html.parser")h2_nodes = soup.find_all("h2",class_="entry-title")for h2_node in h2_nodes:link = h2_node.find("a")print(link["href"],link.get_text())
      
  2. 通过标题爬取所有博客文章

    """
    爬取所有博客文章
    """
    import refrom utils import url_manager
    import requests
    from bs4 import BeautifulSouproot_url="http://www.crazyant.net"# 将root_url添加到urls中
    urls = url_manager.UrlManager()
    urls.add_new_url(root_url)# 获取所有页面内容,并保存到文件
    fout = open("craw_all_pages.txt","w",encoding="utf-8")
    while urls.has_new_url():curr_url = urls.get_url()r = requests.get(curr_url,timeout=2)if r.status_code != 200:print("请求失败",curr_url)continuesoup = BeautifulSoup(r.text,"html.parser")title = soup.title.string # 获取标题fout.write('%s\t%s\n' % (curr_url, title))# 写入文件fout.flush()# 刷新缓冲区,直接写入文件print("success: %s, %s, %d"%(curr_url,title,len(urls.new_urls)))# 获取所有链接, 并添加到urls中links = soup.find_all("a")for link in links:href = link.get("href")if href is None:continuepattern = r"^http://www.crazyant.net/\d+.html$" # 匹配规则,匹配以http://www.crazyant.net/开头,并且以.html结尾的url# 正则匹配, 返回一个匹配对象,如果没有匹配到,返回Noneif re.match(pattern,href):urls.add_new_url(href)fout.close()
    
  • 运行结果
    在这里插入图片描述
http://www.tj-hxxt.cn/news/103088.html

相关文章:

  • 在日本做网站响应式网站建设
  • 中学生设计的网站好口碑关键词优化地址
  • 企业网站模板 下载 论坛seo优化招商
  • java可以做网站后台吗泰安百度推广电话
  • 网站做营利性广告需要什么备案公司排名seo
  • etsy网站开鲁网站seo不用下载
  • 建设厅的工程造价网站个人网站建设
  • app定制服务公司性价比高seo排名
  • 东莞php网站开发网络营销出来可以干什么工作
  • 中企动力科技股份有限公司怎么样seo网站优化方案
  • 把nas做网站操作流程网站关键词在哪里看
  • 免费云主机试用专业seo培训
  • 网站制作公司挣钱吗网络销售怎么做才能做好
  • 做卡盟网站教程佛山seo代理计费
  • 广州网站建设企业百度产品推广
  • 网站建设方法做seo需要投入的成本
  • 丰台做网站的公司百度大数据查询平台
  • 牡丹江有做网站的人吗网站seo哪家公司好
  • 代做ansys网站seo快速排名源码
  • 房地产网站大全英语seo
  • 东莞哪家做网站百度信息流推广平台
  • 小学学校网站模板免费下载seo优化主要做什么
  • 南京 百度 网站建设免费建站网站大全
  • 北京制作网站软件软文网官网
  • 网站后台添加内容网页不显示直通车关键词优化
  • 素材网站可以做淘宝吗网络营销的主要方式和技巧
  • 请人做网站花多少钱seo排名资源
  • 家用电脑可以做网站吗域名注册需要什么条件
  • 怎么制作公司自己网站怎么建网站卖东西
  • 南昌专业做网站公司郑州seo询搜点网络效果佳