当前位置: 首页 > news >正文

门户网站建设运营正规的关键词优化软件

门户网站建设运营,正规的关键词优化软件,舆情信息网,郑州专业做网站公【腾讯云 TDSQL-C Serverless产品体验】抓取processon热门模版的标题生成词云 serverless服务是腾讯云自研的新一代云原生关系型数据库TDSQ L-C的无服务器架构版,是全Serverless架构的云原生数据库 前言 体验了一下腾讯云刚出的TDSQL-C Serverless,使用…

【腾讯云 TDSQL-C Serverless产品体验】抓取processon热门模版的标题生成词云

serverless服务是腾讯云自研的新一代云原生关系型数据库TDSQ L-C的无服务器架构版,是全Serverless架构的云原生数据库

前言

体验了一下腾讯云刚出的TDSQL-C Serverless,使用它存储数据比较方便,能根据负载动态扩容,现在我们正好用来爬下数据分析一下。

数据源

processOn是比较常用的画图平台,它的模版也是比较丰富,但是基本上都要钱。。。
现在我们爬一下数据,看下这些推荐的模版标题的构成,即什么样的词汇比较容易被推荐,还有它的价格分布是怎样的
在这里插入图片描述

项目目录

config存储配置文件,dao负责链接数据库,logic下面就是具体的逻辑,包括爬虫、分析、词云分词。
在这里插入图片描述

爬虫

具体爬虫代码如下,这里才有异步存储,也正好测试下数据库的性能如何

import ("fmt""github.com/anaskhan96/soup""github.com/spf13/cast""strings""sync""td_test/logic/wordcloud"
)func Crawl(url string) error {res, err := soup.Get(url)if err != nil {return err}var wg sync.WaitGroupdoc := soup.HTMLParse(res)// 模版列表tempList := doc.FindAll("div", "class", "list-item-content")for _, item := range tempList {// 模版详情数据detail := item.Find("div", "class", "temp-item-detail")title := detail.Find("h2").Text()// view clone like数量var countList []intfor _, count := range detail.FindAll("span", "class", "count") {countList = append(countList, cast.ToInt(count.Text()))}// 获取价格owner := item.Find("div", "class", "temp-item-owner")priceStr := owner.Find("span", "class", "count").Text()var price float32if priceStr != "免费" {priceStr = strings.Trim(priceStr, "¥")price = cast.ToFloat32(priceStr)}// 异步存储go func() {wg.Add(1)defer wg.Done()saveToDB(title, countList, price)// 对标题进行分词并存储wordcloud.SplitTitleAndSave(title)}()}wg.Wait()return nil
}

分词

分词库用的是结巴分词,直接用它的精准模式即可

import ("github.com/yanyiwu/gojieba"
)var splitClient *gojieba.Jiebafunc init() {splitClient = gojieba.NewJieba()
}
func SplitTitleAndSave(title string) {words := splitClient.Cut(title, true)for i := range words {m := &TemplateTitleWordModel{Word: words[i]}m.Save()}return
}

分析词云和价格饼状图

词云和饼状图都是用的github.com/go-echarts/go-echarts,使用比较简单,词云需要把数据从数据库中提取出来塞进去就好了,词云代码:

func getTitleListFromDB() []opts.WordCloudData {var wordList []stringdao.GetDB().Raw("select word from template_title_words").Scan(&wordList)wordMap := make(map[string]int)for i := range wordList {wordMap[wordList[i]]++}ans := make([]opts.WordCloudData, 0)for k, v := range wordMap {ans = append(ans, opts.WordCloudData{Value: v, Name: cast.ToString(k)})}return ans
}
func createWordCloud(title string, data []opts.WordCloudData) {wc := charts.NewWordCloud()wc.SetGlobalOptions(charts.WithTitleOpts(opts.Title{Title: title}))wc.AddSeries(title, data).SetSeriesOptions(charts.WithWorldCloudChartOpts(opts.WordCloudChart{SizeRange: []float32{40, 80},Shape:     "cardioid",}),)f, _ := os.Create(fmt.Sprintf("wordcloud_%s.html", title))_ = wc.Render(f)
}

生成的词云如下
在这里插入图片描述
价格分布如下
在这里插入图片描述

小结

可以看到,标题中流程图词汇占比最高,价格中五块钱的模版占比最高,其次是3块钱的,再其次是免费的。
TDSQL-C Serverless使用体验上还不错,比较丝滑,感觉和远程数据库差不多,它动态扩缩容能力也能让我们少操点心

http://www.tj-hxxt.cn/news/7786.html

相关文章:

  • 学而思的网站哪里做的企业网站seo服务
  • 怎么找到域名做的那个网站网站注册查询
  • 大型多媒体网站建设工具网站性能优化的方法有哪些
  • wordpress架站教程网站关键词优化系统
  • 工业信息化部网站备案系统百度竞价运营
  • 什么网站做首页电脑优化大师
  • 动态网站订单怎么做热搜词排行榜
  • 大气简约企业网站模板免费下载进行优化
  • 网站费用估算网站优化排名软件推广
  • 建设网站需要了解些什么问题石家庄seo网络推广
  • 网站建设众筹西安网站建设优化
  • 内蒙古建设监理协会网站合肥seo软件
  • 网站建设岗位所需技能自己怎么建网站
  • 华久网站建设网红推广团队去哪里找
  • 向雅虎提交网站四种营销模式
  • 做公司做网站有用吗360竞价推广登录入口
  • 书画网站 建站搜索引擎优化排名
  • 方城网站制作谷歌三件套
  • 阿里云服务器可以做网站宁波seo服务快速推广
  • 网站模板下载百度云链接怎么做的网络营销活动方案
  • 做的课件能做教育部网站查询码百度站长工具添加不了站点
  • 长宁专业网站制作公司互联网广告代理加盟
  • 沈阳盘古网络做网站做的好么阿里指数在哪里看
  • 在线音乐网站源码推广论坛有哪些
  • 眉山网站建设公司国际新闻最新消息今天军事新闻
  • 网站建设公司需要什么公众号推广接单平台
  • 晋中企业网站建设公司百度推广一般要多少钱
  • 做网站域名大概多少钱软文案例500字
  • 网站建设功上海短视频培训机构
  • 做外贸网站的都有哪些类型的公司网络营销软文案例