1.到Python官网https://www.python.org/下载并安装Python,并安装好pip,配置好环境变量。
2.美国的一个实验室网站http://www.lfd.uci.edu/~gohlke/pythonlibs/提供了大量用于Windows平台下的Python第三方扩展包下载。根据自己所下载的版本选择对应的包。所能安装的包可以这样查看。进入shell中,输入:import pip; print(pip.pep425tags.get_supported()),如下所示:
3. 这里按照依赖顺序选择 Numpy+MKL、SciPy、Scikit-learn的包下载,(例如numpy-1.13.0rc2+mkl-cp36-cp36m-win32.whl)。
4.下载完成后,按照上面提到的顺序,依次在下载文件同所在目录的cmd中键入这样的命令(以Numpy+KL为例):
python -m pip install -U numpy-1.13.0rc2+mkl-cp36-cp36m-win32.whl
5.安装完上述扩展包后,就可以通过
import numpy,scipy,sklearn
测试并使用它们。
【注】
(1)Numpy提供一些高级的数学运算机制,还具备非常高效的向量和矩阵运算功能。这些功能对机器学习来说非常重要。http://www.numpy.org
(2)Scipy是在Numpy的基础上构建的更强大,应用领域更广的科学计算包,需要依赖Numpy的支持安装和运行。
(3)对以上两个编程库可参考下面这个在线教程学习用法:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html
(4)Scikit-learn 依托于上述几种工具包,封装了大量经典以及最新的机器学习模型。使用文档:http://scikit-learn.org/stable/user_guide.html
(5)Matplotlib 是一款Python编程环境下免费使用的绘图工具包,其工作方式和绘图命令几乎和MATLAB一致,也可在上面提到的网站下载。在线文档:http://matplotlib.org/contents.html
(6)Pandas 是一款针对数据处理和分析的Python工具包,其中实现了大量便于数据读写、清洗、填充以及分析的功能。文档:http://pandas.pydata.org/pandas-docs/stable/
