环保工程 技术支持 东莞网站建设,怎么做网站的教程,军事新闻大事,网站建设的展望 视频什么是KNN( K近邻算法)
虽然名字中有NN#xff0c;KNN并不是哪种神经网络#xff0c;它全名K-Nearest-Neighbors#xff1a;K近邻算法#xff0c;是机器学习中常用的分类算法。 物以类聚#xff0c;人以群分。KNN的基础思想很简单#xff0c;要判断一个新数据的类别KNN并不是哪种神经网络它全名K-Nearest-NeighborsK近邻算法是机器学习中常用的分类算法。 物以类聚人以群分。KNN的基础思想很简单要判断一个新数据的类别就看它的邻居都是谁。
假设我们的任务是分类水果虽然不知道新来的水果是梨还是苹果但通过观察它的大小和颜色我们找到了它在坐标系中的位置再看看已经确定的苹果和梨都在哪如果附近的苹果多我们就认为它是苹果反之认为它是梨。 KNN中的K指的是K个邻居K3就是通过距离最近的3个样本来判断新数据的类别。 大小和颜色是数据的特征苹果和梨是数据的标签。计算距离时既可以使用两点之间的直线距离也就是欧式距离也可以使用坐标轴距离的绝对值的和也就是曼哈顿距离。
对于KNN来说K的取值非常重要如果K的值太小很容易受个例影响K的值太大又会受到距离较远的特殊数据影响。K的取值受问题自身和数据集大小决定很多时候要靠反复尝试。
KNN算法能做什么
根据花瓣长度、宽度等特征判断植物类别将文本分词、统计词频等处理后判断文章的类型电商、视频网站可以找到与你类似的用户依据他们的选择推荐你可能感兴趣的商品或内容
简单好用的KNN同样存在一定的缺点它的流程是先计算新样本和所有样本之间的距离按由近及远的顺序排序后再按K值确定分类因此数据越多KNN的计算量越大效率也就越低很难应用到较大的数据集中 。