当前位置: 首页 > news >正文

怎么做好邯郸网站建设广州seo网站公司

怎么做好邯郸网站建设,广州seo网站公司,研究生做家教什么网站,网站开发答辩难点主题建模:Top2Vec(理论篇)Top2Vec 是一种用于 主题建模 和 语义搜索 的算法。它自动检测文本中出现的主题,并生成联合嵌入的主题、文档和词向量。 算法基于的假设:许多语义相似的文档都可以由一个潜在的主题表示。首先…

主题建模:Top2Vec(理论篇)

Top2Vec 是一种用于 主题建模语义搜索 的算法。它自动检测文本中出现的主题,并生成联合嵌入的主题、文档和词向量。

算法基于的假设:许多语义相似的文档都可以由一个潜在的主题表示。首先,创建文档和词向量的联合嵌入。一旦文档和单词被嵌入到向量空间中,算法的目标就是找到密集的文档簇,然后找到是哪些单词将这些文档聚集在一起。每个密集区域即为一个主题,将文档聚拢到密集区域的词就是主题词。

1.联合嵌入

使用 Doc2Vec 或 Universal Sentence Encoder 或 BERT Sentence Transformer 创建文档和词向量的联合嵌入。

文档将被放置在靠近其他类似文档和靠近最有区别的词的地方。

在这里插入图片描述

2.降维

使用 UMAP 为文档向量的降维。高维空间中的文档向量非常稀疏,降维有助于找到密集区域。每个点都代表了一个文档向量。
在这里插入图片描述

3.聚类

使用 HDBSCAN 查找文档的密集区域。彩色区域是文档的密集区域。红点是不属于特定集群的异常值。
在这里插入图片描述

4.计算质心

对于每个密集区域,计算文档向量在原始维度的质心,这就是主题向量。红点是异常文档,不用于计算主题向量。紫色点是属于密集区域的文档向量,从中计算主题向量。

在这里插入图片描述

5.词向量排序

找到与生成的主题向量最接近的词向量。最接近的词向量作为主题词。
在这里插入图片描述

http://www.tj-hxxt.cn/news/92529.html

相关文章:

  • 网站制作加教程视频成都百度搜索排名优化
  • 那个b2b网站可以做外贸seo网站管理招聘
  • 导购网站怎么推广在线资源搜索引擎
  • 做t恤网站 一件也可以做企业员工培训内容及计划
  • 想换掉做网站的公司天津百度推广公司电话
  • 展厅效果图网站网络营销推广方式包括哪几种
  • 云南网站开发哪家靠谱防控措施持续优化
  • springboot做音乐网站百度搜索推广流程
  • 淘宝网站官网百度今日小说搜索风云榜
  • 网站怎么做域名torrentkitty磁力搜索引擎
  • 厦门网站建设格兰州seo培训
  • 网站自建设需要买什么时候开始注册公司网上申请入口
  • 给公司做兼职维护网站多少钱无锡网站seo顾问
  • 湘西网站建设花垣百度商品推广平台
  • 免费直播app软件下载seo最新优化技术
  • 网站建设与管理感想杭州网络优化公司排名
  • 做网站卖链接垂直搜索引擎
  • ui设计的基本流程怎么做关键词优化排名
  • 网站客服悬浮电商平台运营方案
  • 公司网站网页设计个人网站制作软件
  • 数据库对于做网站的重要性九易建网站的建站流程
  • 深圳罗湖网站建设市场营销推广方案模板
  • 可以做彩票网站的工作室搜索引擎优化包括哪些
  • 专业的营销型网站建设价格济南头条今日新闻
  • 做门户网站广告近三年成功的营销案例
  • 学校动态网站建设的费用明细产品推广运营的公司
  • 用360打开自己做的网站有广告图片在线转外链
  • 网站开发的需求文档我想注册一个网站怎么注册
  • 做网站的毕设用什么软件培训机构还能开吗
  • 外贸网站建设推广公司价格攀枝花网站seo