当前位置: 首页 > news >正文

网站案例分析百度快照推广有效果吗

网站案例分析,百度快照推广有效果吗,网站常用参数,苏州互联网公司在哪个区前言 俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓类,通俗地说,就是指相似元素的集合。 而对于分类问题,我们通常不会提供x与y这样的映射关系&#xff0…

前言

俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓类,通俗地说,就是指相似元素的集合。

而对于分类问题,我们通常不会提供x与y这样的映射关系,对于这种用机器自动找出其中规律并进行分类的问题,我们称为聚类。

聚类在实际的应用中亦是非常广泛的,如:市场细分(Market segmentation)、社交圈分析(social network analysis)、集群计算(organize computing clusters)、天体数据分析(astronomical data analysis)

K均值(K-means)

在聚类分析中,我们希望能有一种算法能够自动的将相同元素分为紧密关系的子集或簇,K均值算法(K-means)为最广泛的一种算法。k-means是硬分类,一个点只能分到一个类。

接下来我们会以图解的形式讲解该算法。

假设我们有9个点,我们要把九个点分为三类

首先,我们在图中随机选择三个点

在这里插入图片描述

把距离这三个点最近的其他点归为一类

在这里插入图片描述

取当前类的所有点的均值,作为中心点

在这里插入图片描述

更新距离中心点最近的点

在这里插入图片描述

再次计算被分类点的均值作为新的中心点

在这里插入图片描述

再次更新距离中心点最近的点

在这里插入图片描述

计算中心点

在这里插入图片描述

当所有的点无法再更新到其他分类时,算法结束,此时继续迭代,聚类中心将不会再做改变。

k-means算法,输入有两个部分:K(聚类的个数):number of clusters,训练集 x ( 1 ) , x ( 2 ) , . . . , x ( m ) x^{(1)},x^{(2)},...,x^{(m)} x(1),x(2),...,x(m)

​随机初始化K个聚类中心 μ 1 , μ 2 , . . . , μ k \mu_1,\mu_2,...,\mu_k μ1,μ2,...,μk,重复以下迭代:

for i=1:m

c ( i ) c^{(i)} c(i)=从1到K的所有聚类中心索引(index)中最接近于 x ( i ) x^{(i)} x(i)的索引,即

c ( i ) = m i n k ∣ ∣ x ( i ) − μ k ∣ ∣ 2 c^{(i)}=min_k||x^{(i)}−\mu_k||^2 c(i)=minkx(i)μk2

​for k=1:K

μ k \mu_k μk=对于接近于聚类k点处平均值,即

μ k = 1 n ∑ n x ( i ) \mu_k = \frac{1}{n} \sum_{n} x^{(i)} μk=n1nx(i)

但是,k-means也有其缺点,例如,我们有9个点,初始点我们选择了图中的这三个

在这里插入图片描述

根据前面的算法,我们最终的结果是这样的

在这里插入图片描述

显然,这并不是我们期望的结果,算法最终陷入到了局部最优解中。

最远点初始化

从上面的问题就可以发现,其实k-means算法的关键就是找到合理的初始化点,初始化点的位置会影响到最终的结果好坏。这里我们介绍一种优化方案,最远初始化。

首先,我们还是随机选一个点,例如图中的红点

在这里插入图片描述

接下来,我们要选择一个距离红点最远的点,图中绿点

在这里插入图片描述

最后,再选一个距离红点第二远的点,图中黑点

在这里插入图片描述

初始化完成后根据前面提到的算法完成分类

在这里插入图片描述

但是,该算法还是有一些问题,对于绿点,如果是噪声的话,我们最终把噪声分成了一类,这也并不是我们想要的结果,那么怎么解决这个问题呢?

K-means++

对于噪声,我们知道都是一些很少量的数据,那么,在我们选择点的时候,我门要给所有的点一个权重,例如上面的绿点,虽然距离最远,但是只有一个点,其权重较小,而对于(0,1)与(0,-1)附近的点很多,其权重就大。例如,我们设绿点的权重是1/10,(0,1)与(0,-1)的点权重是1/30,但是其数量很多,假设有10个点,那么权重就可以理解为多个点的和,那就是1/3,所以,最终初始化的点会选择(0,1)与(0,-1)附近,噪声问题也就解决了。

在这里插入图片描述

K-means算法首先需要选择k个点,每次要计算其余n各点的距离,假设每个点的维度是d,那么最终的时间复杂度是 O ( n k d ) O(nkd) O(nkd),可见其算法是线性的,效率很高。

K值的选择

对于K值的选择,我们可以考虑使用交叉验证,根据损失函数来选择最优的K

J = ∑ i = 1 n m i n k ∣ ∣ x ( i ) − μ k ∣ ∣ 2 J = \sum_{i=1}^n min_k||x^{(i)}−\mu_k||^2 J=i=1nminkx(i)μk2

损失函数最终会有一个拐点,根据这个拐点我们就能选择最佳的K值

在这里插入图片描述

http://www.tj-hxxt.cn/news/53467.html

相关文章:

  • 网站开发设计总结哈尔滨seo关键词排名
  • wordpress 网站建设外链发布论坛
  • 网站域名打不开的原因百度网站域名
  • 网站开发技术知识枣庄网络推广seo
  • 赚钱网站怎么做怎么注册网站 个人
  • 做网站需要什么人淘宝产品关键词排名查询
  • wordpress 七牛云插件武汉百度推广优化
  • 网站网页设计优秀案例百度登录首页
  • 网站制作网站制作公司seo会被取代吗
  • 广州化妆品网站建设公司排名关键词优化报价怎么样
  • 天津建设协会网站首页百度账号购买网站
  • 网络系统的主要设备有seo外包公司多少钱
  • 做网站开发需要学什么seo网站推广批发
  • 网站开发和后期维护费用google关键词推广
  • 电商培训内容太原seo招聘
  • 网站推广结束语泰州百度seo
  • 旅行网站建设方案策划书免费b站网站推广
  • html网页期末作业模板seo短视频网页入口引流免费
  • 优度公司做的网站小广告网站
  • 怎么修改字体wordpress湖南正规关键词优化
  • 中职电子商务网站建设与维护考试题广告公司广告牌制作
  • 产品宣传型企业网站怎么建设福州短视频seo方法
  • 测量为什么要建站软文营销名词解释
  • 工业皮带怎么做免费的网站重庆seo俱乐部联系方式
  • 推动高质量发展的举措长尾词seo排名
  • 新手做网站需要多久seo网上培训多少钱
  • 商城网站哪个公司做的好处新产品推广策划方案
  • 无锡做网站365caiyi淘宝排名查询
  • 杭州做网站软件海外aso优化
  • 网页制作免费网站建设恢复正常百度