by @梁斌
部分内容整理自互联网,感谢众多同学的分享。
1. 项目介绍
针对科学计算领域的Python开源库生态系统在过去十几年中得到了飞速发展。本项目主要介绍如何利用Python进行数据控制、处理、整理、分析等方面的基本要点,包括用于高效解决各种数据分析问题的Python语言和库。希望让大家能了解如何运用Python进行数据分析,并能在随后的实际项目中将这里所介绍的工具高效地运用。
2. 预备知识
2.1 Python安装
2.2 编程环境(IDE)
以下IDE选择一个即可
- PyCharm,Community版本已够用
- Eclipse + PyDev (Eclipse下载, PyDev下载)
- IPython,Anaconda已包含
- Visual Studio Code
- 其他…
2.3 Python基础知识
2.4 常用的数据分析Python库
- NumPy(Numerical Python),Python科学计算的基础包。
- SciPy(Scientific Python),一款方便、易于使用、转为科学和工程设计的Python工具包。
- Matplotlib,Python著名的绘图库。
- Pandas(Python Data Analysis Library),基于Numpy构建的含有更高级数据结构和工具的数据分析包。
- scikit-learn,基于Python的机器学习模块。
3. 案例讲解
3.1 案例说明
- 1880-2014年间全美婴儿姓名分析
- 项目地址
- 如果从Kaggle下载数据有困难,可以从这里获取:https://pan.baidu.com/s/1ejmMom 密码:yt33