做情侣网站,电子商务网站建设学什么软件,建旅游网站多少钱,企业网站是企业在互联网上进行网络营销我不是计算机专业#xff0c;第一次接触机器学习还是在研一的时候#xff0c;当时是看到机器学习可以做号码识别#xff0c;就觉得好厉害#xff0c;想学这个。 首次了解到Python这门语言#xff0c;知道了机器学习可以做什么后#xff0c;就感觉打开了新世界一样。再后来…我不是计算机专业第一次接触机器学习还是在研一的时候当时是看到机器学习可以做号码识别就觉得好厉害想学这个。 首次了解到Python这门语言知道了机器学习可以做什么后就感觉打开了新世界一样。再后来也就开始学习Python、学习机器学习。 到现在也积累了一些经验总结了一下分享给大家作学习参考。
机器学习基础信息
概念
我们人在面对一个新的问题的时候会想到用我们已有经验总结出来对的规律解决这个问题。而机器学习要做的事情也差不多在面对一个新问题的时候机器从已有的历史数据总结出一个规律套用在新问题上进而解决这个问题。
机器学习和人学习的过程用下面这个图片表达
机器学习定义“A computer program is said to learn from experience E with respect to some class of tasksT and performance measureP if its performance at tasks inT, as measured by P, improves with experience E ”
翻译过来是“一个电脑程序要完成任务T如果电脑获取的关于T的经验E越多就表现P得越好那么我们就可以说这个程序‘学习’了关于T的经验。”
简单理解为是机器学习从历史数据中提取规律特征总结训练出模型并对新数据做出预测。
机器学习与人工智能、深度学习的关系
三者之间的关系是逐层递减的可以用下面这个图片来理解 机器学习应用方向
机器学习的应用面很广在我们的生活中已经有很多方面都有相关的应用。比如**聊天机器人、人脸识别、垃圾邮箱拦截、语言翻译、计算机视觉、自然语言处理、数据挖掘**等方面。
除了这些应用还有现在出现的各种大模型也多是基于机器学习框架生成的。例如现在火遍全球的大模型OpenAI表示大模型使用了一种名为“利用人类反馈强化学习”RLHF的机器学习技术进行训练的。
大模型作为当前全球热门技术会给我们的生活带什么样的影响想要在这波红利中给自己带来更多收益要学习哪些技能推荐大家看看在线推出的**【程序员的AI大模型进阶之旅】公开课**行业大佬带你了解最新技术提升自己认知。这些公开课还推出两大福利:AI 大模型资料包无需翻墙的好用AI工具名称和网址帮助你快人一步。微信扫描下方二维码即可免费领取 机器学习学习内容
机器学习三要素
三要素即为数据、模型、算法。三者贯穿机器学习整个过程缺一不可。
机器学习是由数据驱动的这些数据都是收集到的客观可量化数据模型则是机器学习中采用什么样的模型或者说方法进行预测和拟合算法可以理解为一个优化的过程最终确定最优模型。
机器学习分类
机器学习可以分为监督学习、无监督学习、强化学习。
监督学习
通过有数据标签的数据进行训练一般可以有回归和分类两类方式。 监督学习的算法主要有线性回归、逻辑回归、支持向量机、决策树、随机森林、K-近邻、朴素贝叶斯、AdaBoost、梯度提升树、神经网络。 无监督学习
没有数据标签对的数据进行训练这类方法的目标是找到数据集底层联系有聚类和关联两类。 无监督学习的算法主要有K-均值聚类、层次聚类、DBSCAN、主成分分析、独立成分分析、t-SNE。
强化学习
强化学习通过智能体与环境的交互和反馈学习到最优的策略来最优化奖励。
强化学习的算法主要有Q-学习、SARSA、深度Q网络、策略梯度方法、Actor-Critic 方法、Proximal Policy Optimization。
机器学习流程 1.收集数据
2.数据预处理主要包括缺失值处理、异常值处理、重复值处理等。
3.训练模型对经过预处理后的数据进行模型训练结合自己的目的分类、回归、聚类等选择合适的训练方式。
4.模型评估通过训练好的模型对数据测试集进行测试通过评估指标来评价训练模型的好坏一般评估指标有准确率、查准率、查全率、均方根误差、ROC 和 AUC等。
5.优化这个也可以叫做调参过程通过找到最好的参数可以让模型的性能提高一大截有传统的手工调参、网格搜索、随机搜索、贝叶斯搜索等方法。
6.预测最后一步这是对新数据或新样本的推断或预测。
机器学习需要那些知识
学好机器学习需要有一定的数学基础和计算机编程基础。总结一下学机器学习需要下面这几方面知识
数学基础机器学习中很多方面都设计到了数学知识较好的数学知识可以在理解和应用机器学习中发挥积极的作用一般包括线性代数、微积分、概率论和统计学等。
编程基础这个是肯定的了只有一定的编程基础才能看得懂、用得了、写得好算法。现在常说的是Python此外C或java也可以。
了解数据结合和算法算法涉及到了很多数据结构如图、树、排序等掌握这些数据结构和算法很重要。
基础机器学习算法知识前文也说了机器学习中有很多算法因此也需要掌握一些基础算法例如支持向量机、神经网络、决策树、逻辑回归等。
此外还有一些知识也需要注意比如**特征提取、模型评估及调优**等。
优质资源推荐
这儿我总结了很多优质资源都是大家在学习机器学习的时候最常用的、效果最好的内容。
书籍
《机器学习》
又叫西瓜书作者周志华。这本书可以作为机器学习的入门读物。基本上涵盖了机器学习基础知识的方方面面。每章都附有习题并介绍了相关阅读材料以便有兴趣的读者进一步钻研探索。
《统计学习方法》 作者李航。这本书也是机器学习的入门级读物本书机器学习原理的解释、公式的推导非常非常详尽。全面系统地介绍了统计学习的主要方法现在有第二版分为监督学习和无监督学习两个部分。
《机器学习实战》 作者Peter Harrington。在看完前面两本书后再跟着本书里的代码进行学习和实操效果会更好。书中也精心编排了很多实例从实例入手更能帮助大家理解机器学习中的各种名词。
其他资源
吴恩达 deeplearning.ai
林轩田 机器学习基石 吴恩达机器学习课程是很多人的入门机器学习的第一堂课。之前的课程时间有点久了可以看看2022年出的新版。 这个也是很多同学在学校的时候经常看到基础入门课。
李宏毅 机器学习课程 大多数同学反应李宏毅讲的课程相对于吴恩达更能接受一些。
各Python库的官方文档
TensorFlowhttps://www.tensorflow.org/tutorials/
pytorchWelcome to PyTorch Tutorials — PyTorch Tutorials 2.0.1cu117 documentation
scikit-learnhttps://scikit-learn.org/stable/index.html
numpyhttps://numpy.org/
pandashttp://pandas.pydata.org/pandas-docs/stable/
matplotlibhttps://matplotlib.org/stable/tutorials/index.html
以上就是本次的分享最后提醒大家一下想要学好机器学习最重要的还是要实践。通过遇见问题、发现问题、解决问题不断地提高自己的能力。