很多小伙伴在学习机器学习的时候会苦恼到底用什么进行学习。在看了大佬的介绍后可能会使用Keras或者pytorch直接进行学习,但实际上有优秀的机器学习工具包。今天小编就为大家介绍SKlearm的安装与使用,希望大家能喜欢上这款工具包。
SKlearn是什么
Sklearn(全称SciKit-Learn),是基于Python语言的机器学习工具包。
Sklearn主要用Python编写,建立在Numpy、Scipy、Pandas和Matplotlib的基础上,也用Cython编写了一些核心算法来提高性能。
Sklearn包括六大功能模块:
分类(Classification):识别样本属于哪个类别,常用算法有SVM(支持向量机)、nearestneighbors(最近邻)、randomforest(随机森林)
回归(Regression):预测与对象相关联的连续值属性,常用算法有SVR(支持向量机)、ridgeregression(岭回归)、Lasso
聚类(Clustering):对样本进行无监督的自动分类,常用算法有k-Means(k均值)、spectralclustering(特征聚类)、mean-shift(均值漂移)
数据降维(Dimensionalityreduction):减少相关变量维数,常用算法有PCA(主成分分析)、featureselection(特征选择)、non-negativematrixfactorization(非负矩阵分解)
模型选择(ModelSelection):比较,验证,选择参数和模型,常用模块有gridsearch(网格搜索)、crossvalidation(交叉验证)、metrics(度量)
数据处理(Preprocessing):特征提取和归一化,常用模块有preprocessing(预处理),featureextraction(特征提取)
这六个功能模块涉及4类算法,分类、回归属于监督学习,聚类属于非监督学习。
SKlearn的安装
Sklearn的安装要求:Python3.5以上版本,需要安装NumPy、SciPy、Pandas工具包的支持,部分内容需要使用Matplotlib、joblib工具包。
pip安装命令:
pip3install-Uscikit-learn
pip3install-Uscikit-learn-ihttps://pypi.douban.com/simple
注意Sklearn建议安装Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/找到你需要的numpy+mkl版本,下载后pip3安装:
pipinstallnumpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl
Sklearn数模笔记的计划
粗略看看Sklearn的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解Sklearn的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。
以上就是就是SKlearm的安装与使用的全部内容了,希望能对大家提供帮助。
>>>>>>点击进入Python专题
上一篇:为什么需要分布式锁以及如何实现?
下一篇:人工智能软件吞噬硬件的AI时代
¥299.00
¥399.00
¥29.00
¥498.00