算法应用机器学习python应用,初识机

北京白癜风最专业的医院 http://pf.39.net/bdfyy/xwdt/

本系列文章主要介绍机器学习在实践中的应用,介绍利用Python的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大家使用机器学习来处理和分类与回归模型相关的问题。每个算法模型都介绍其较为通用且实用的建模过程,力争使基础较差的读者也能无障碍利用python来使用机器学习算法。

1初识机器学习

1.1什么是机器学习?

机器学习(MachineLeaming,ML)是一门多领域的交叉学科,涉及概率论、统计学、线性代数、算法等多门学科。它专门研究计算机如何模拟和学习人的行为,以获取新的知识或技能,重新组织已有的知识结构使之不断完善自身的性能。

机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

机器学习的算法分为两大类:监督学习和无监督学习。

监督学习即在机器学习过程中提供对错指示。一般是在数据组中包含最终结果(0,1),通过算法让机器自己减少误差。这一类学习主要应用于分类和预测(RegressionClassify)。监督学习从给定的训练数据集中学习出一个目标函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出,也可以说包括特征和目标,训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。非监督学习又称归纳性学习(Clustering),利用K方式(KMean)建立中心(Centriole),通过循环和递减运算(lterationDescent)来减小误差,达到分类的目的。

机器学习解决的问题:分类,回归,降维,聚类。其中有些算法适合多种问题,有些只适合解决一种问题,下面列出一些常见的一些机器学习算法。

分类算法:逻辑回归,贝叶斯回归算法:线性回归,岭回归,lasso,弹性网络聚类:Kmeans,DBSCAN,层次聚类,光谱聚类分类回归:KNN,决策树,神经网络,随机森林,梯度提升树、xgboost分类回归聚类:SVM降维:PCA1.2学习机器学习的误区

在学习机器学习之前,有一些理解和误区需要先做好说明,防止大家在学习机器学习的过程中过于钻牛角尖。对于通过Python来基本实现机器学习算法,有几个误区可能是比较广泛存在的,应该尽量避免:

1、必须非常熟悉Python的语法和擅长Python的编程。实际上并不需要,Python有scikit-learn模块等可以直接进行建模的调用包,基本只需要学会python的各种基础的知识和应用,熟悉scikit-learn的相关模型用法,以及包括numpy、pandas、matplotlib模块在内的常用的数据处理和可视化包,就可以实现各种机器学习算法了。

2、必须非常深入地学习和理解在scikit-learn中使用的机器学习的理论和算法。实际上也不需要,除非你是这一方向的硕士甚至博士学位的学习者。机器学习不同的算法涉及的知识点是非常广阔的,要做到每一种算法的理论知识的学习都非常深入,是比较难的,实际上简单的机器学习应用中,只需要了解不同算法的基础知识就可以使用了。

3、学习知识就行了,不需要做什么项目。恰恰相反,机器学习的应用是需要大量的项目经验积累,才能把机器学习用得更好。

这些方式对一部分人可能会非常有效,但是这会降低掌握机器学习技能的速度和要达到通过机器学习来解决问题的目标。这也会浪费大量时间单独学习机器学习算法,但却不知如何利用机器学习来解决现实中遇到的问题。实际上利用Python来实现机器学习算法的门槛并不高,在基本运用过程中,只需要了解机器学习各种算法的一些基础知识,一些常用流程和不同算法,数据集的要求就可以了。

1.3Python中的机器学习

本系列文章主要


转载请注明:http://www.aierlanlan.com/grrz/6223.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了