网站推广文章 优帮云,深圳建网站培训机构,宜城市城乡建设局网站备案,忘记网站后台密码一、研究背景
乳腺癌属于恶性肿瘤#xff0c;在早期发现后需要及早将病变组织切除#xff0c;而且术后还要化疗和放射等辅助治疗#xff0c;能够抑制癌细胞的扩散和增长。
二、研究目的
研究乳腺癌病人的患病特征通过聚类分析方法对特征进行分类通过上述聚类结果对乳腺诊…一、研究背景
乳腺癌属于恶性肿瘤在早期发现后需要及早将病变组织切除而且术后还要化疗和放射等辅助治疗能够抑制癌细胞的扩散和增长。
二、研究目的
研究乳腺癌病人的患病特征通过聚类分析方法对特征进行分类通过上述聚类结果对乳腺诊断给出建议
三、数据来源
机器学习(sklearn)库中美国威斯康星州乳腺癌的数据集包含乳腺癌患者的肿瘤特征的测量值。
breast_cancer — scikit-learnhttps://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html
四、实验仪器 Windows 11SPSSPyCharm ProfessionalRJupyter Notebook 五、数据集介绍 5.1 数据来源
本实验数据来自机器学习中美国威斯康星州乳腺癌数据集包含569个患有乳腺癌的人群。
5.2 选择的病理特征
平均半径平均纹理平均周长平均面积平均平滑度平均紧凑度平均凹度平均对称性平均分形
六、系统聚类法
6.1 近似值矩阵 本实验使用SPSS进行操作本文在计算距离时采用平方欧式距离所以样品间距离越大样品差异越大。而在计算类与类之间的距离时本文采用的是最短距离法在SPSS中对应为最近邻元素。如下表所示平均周长与平均半径间距离最小最先聚为一类。
6.2 集中趋势 上表为SPSS输出聚类系数表接下来使用Python进行绘图得到下面的折线图。
6.3 聚合系数与谱系图 由图1得出当分类数大于4时曲线的变化趋于平稳为此分类数等于4符合分类目的。最后使用SPSS 绘制出了系统聚类的谱系图如图2所示。 通过谱系图得出四类的特征分别为
第一类为平均半径平均周长平均面积平均凹度平均对称性平均紧凑度刻画了乳腺的表面特征通过表面特征地识别出乳腺癌的患病前兆第二类为平均平滑度识别诊断出乳腺癌第三类为平均分形刻画了乳腺的内在因素对乳腺癌的患病前兆的识别第四类为平均纹理刻画乳腺的纹理形状对乳腺癌诊断识别的重要性。
七、总结与建议
7.1 总结
通过聚类结果我们总结发现乳腺癌的四类病理特征 平均半径平均周长平均面积平均凹度平均对称性平均紧凑度 平均平滑度 平均分形 平均纹理通过对病人的上述四类病理特征进行检测则可以帮助初步判断乳腺癌在数据较少或者缺失的时候可以从这四类的特征初步判断其乳腺癌的风险。
7.2 建议 1、建立良好的生活方式调整好生活节奏保持心情舒畅。 2、坚持体育锻炼积极参加社交活动避免和减少精神、心理紧张因素保持心态平和。 3、养成良好的饮食习惯。 婴幼儿时期注意营养均衡提倡母乳喂养。儿童发育期减少摄入过量的高蛋白和低纤维饮食。青春期不要大量摄入脂肪和动物蛋白加强身体锻炼。绝经后控制总热量的摄入避免肥胖。平时养成不过量摄入肉类、煎蛋、黄油、奶酪、甜食等饮食习惯少食腌、熏、炸、烤食品增加食用新鲜蔬菜、水果、维生素、胡萝卜素、橄榄油、鱼、豆类制品等。 4、积极治疗乳腺疾病。 5、不乱用外源性雌激素。 6、不长期过量饮酒。