当前位置: 首页 > news >正文

中学网站域名用什么用多语言网站建设费用

中学网站域名用什么用,多语言网站建设费用,wordpress 多重筛选,美的网站建设前言 聚类算法是无监督学习中最经典的问题之一#xff0c;虽然 K-Means 用得广泛#xff0c;但它有明显的局限性#xff1a; 无法识别任意形状的簇需要提前指定簇的个数 K对噪声和离群点非常敏感 上一篇介绍了K-Means算法#xff0c;本文将介绍一下DBSCAN#xff08;De…前言 聚类算法是无监督学习中最经典的问题之一虽然 K-Means 用得广泛但它有明显的局限性 无法识别任意形状的簇需要提前指定簇的个数 K对噪声和离群点非常敏感 上一篇介绍了K-Means算法本文将介绍一下DBSCANDensity-Based Spatial Clustering of Applications with Noise基于密度的噪声应用空间聚类可以不用担心这些局限 DBSCAN简介 DBSCAN 是一种基于密度的聚类算法核心思想是 “密度高的区域形成簇密度低的区域是噪声或边界”。 与 K-Means 不同DBSCAN 不要求指定簇的个数而是通过“密度”定义簇。 DBSCAN 的核心概念 1. 邻域ε邻域 对于任意一点 p p p其ε邻域是以 p p p 为圆心、半径为 ε 的圆或球内的点。 2. 密度可达density reachable 如果点 q q q 在点 p p p 的 ε 邻域内且 p p p 是“核心点”那么 q q q 被称为从 p p p 密度可达。 3. 核心点core point 如果某点的 ε 邻域内的点的个数 ≥ MinPts最小点数则它是核心点。 4. 边界点border point 在核心点的 ε 邻域内但自身邻域不足 MinPts不是核心点。 5. 噪声点noise point 既不是核心点也不属于任何核心点邻域。 算法流程 输入 数据集 D参数 ε邻域半径参数 MinPts邻域最小点数 主要步骤 遍历所有点为每个未访问点执行以下操作如果该点的 ε 邻域内有 ≥ MinPts 点 → 标记为“核心点”开始新簇递归扩展把它邻域中的所有密度可达的点加入该簇如果邻域点数不足 MinPts → 标记为“噪声”或“边界点”重复直到所有点被处理。 用一句话总结 从任意一个核心点出发将其“邻居的邻居的邻居…”全都拉入簇中直到遇到边界或稀疏区域。 DBSCAN vs K-Means 特性K-MeansDBSCAN是否需要指定簇数 K✅ 是❌ 不需要是否能处理异常值❌ 敏感✅ 能自动识别为噪声点是否支持任意形状簇❌ 仅支持球状✅ 支持任意形状是否稳定❌ 对初始点敏感✅ 参数敏感但更鲁棒 Python 实战代码 我们使用 sklearn 中的 DBSCAN import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_moons from sklearn.cluster import DBSCAN# 生成非球形数据 X, _ make_moons(n_samples300, noise0.05, random_state0)# 运行 DBSCAN,后续会介绍如何确定这两个参数eps和minsamples #epsε 邻域的半径 #minsamples最小密度点数 MinPts含自身 dbscan DBSCAN(eps0.2, min_samples5) labels dbscan.fit_predict(X)# 可视化结果 plt.scatter(X[:, 0], X[:, 1], clabels, cmaprainbow, s30) plt.rcParams[font.sans-serif] [SimHei] plt.title(DBSCAN 聚类结果) plt.show()从图可以看到 弯月形状的两个簇成功分开中间稀疏的点自动识别为噪声label -1无需手动指定“2个簇”。 eps 和 MinPts参数 这是 DBSCAN 唯一的难点。 一个实用技巧是使用 K-距离图 对每个点计算其到第 MinPts 个最近邻的距离将这些距离排序并绘图找“拐点”突变处即为合适的 ε。 from sklearn.neighbors import NearestNeighborsneighbors NearestNeighbors(n_neighbors5) neighbors_fit neighbors.fit(X) distances, _ neighbors_fit.kneighbors(X) distances np.sort(distances[:, 4]) # 第5个最近邻 plt.plot(distances) plt.rcParams[font.sans-serif] [SimHei] plt.title(K-距离图) plt.show()DBSCAN 的优缺点总结 优点 自动识别簇数可检测任意形状簇能发现异常点不敏感于初始点。 缺点 对参数 eps MinPts 较敏感在不同密度数据上表现不佳高维空间中“密度”概念变得模糊,也叫维度灾难。 应用场景 地理空间数据聚类如用户聚集区社交网络关系发现图像去噪异常检测如金融欺诈、网络攻击等 总结 DBSCAN 是一款“智能划圈工具”自动围出密集人群忽略稀疏路人。 在你不想手动选 K、希望识别复杂形状簇、同时处理异常点时DBSCAN 是你的好帮手
http://www.tj-hxxt.cn/news/233841.html

相关文章:

  • 网站建设公制度重庆必去的十大景点
  • php做直播类型的网站学院网站建设招标书
  • 云主机搭建asp网站有关外贸的网站有哪些
  • 个性化网站建设报价科技网站建设 开题报告
  • 自己做网站在线看pdf湖北网站建设服务公司
  • 企业做网站应注意什么潍坊网站建设策划
  • 专门做二维码的网站h5免费模板下载
  • 电商网站建设 猪八戒网房屋装修设计软件哪个好用
  • 潍坊网站seo制作婚恋网站
  • 能查个人信息的网站北京网页设计工资
  • 网站建设要托管服务器设计师应该知道的网站
  • wordpress linux下载seo咨询邵阳
  • 怎么在试客网站做佣金单百度验证网站所有权
  • 自己做个网站用什么软件好建设银行网站点不进去了怎么办
  • 网站怎么做微博链接wordpress如何添加顶层菜单
  • 做旅游网站抖音广告推广
  • 商城网站怎样做wordpress 被挂马
  • 如何搭建手机网站源码路由器当服务器做网站
  • shopex网站首页空白wordpress网站二次开发
  • 外包公司做网站有哪些内容桂林象鼻山水月洞
  • 动易网站开发的主要技术自己建设网站需要什么手续
  • 网站建设公司推荐 金石下拉万盛建设局官方网站
  • wordpress怎么写网站关键词和描述建设一个网站可以采用那几方案
  • 贵州网站中企动力建设wordpress域名重定向
  • 内蒙古网站建设流程网站优化需要做什么
  • 阿里巴巴如何做网站中信建设有限责任公司杨峰
  • app手机网站建筑网址导航
  • 北京自适应网站建设七冶建设集团网站 江苏
  • 个人宽带 架设网站需备案营销策划思路
  • 传统网站模版青岛网站制作案例