- 第1章 实验环境的搭建
本章将主要介绍Anaconda和Jupyter Notebook。包括如何在windows,Mac,linux等平台上安装Anaconda,以及Jupyter Notebook的基本启动使用方法。
- 1-1 导学视频
- 1-2 Anaconda和Jupyter notebook介绍
- 1-3 Anaconda在Mac上的安装演示
- 1-4 Anaconda在windows上安装演示
- 1-5 Anaconda在Linux上的安装演示
- 1-6 Jupyter-notebook的使用演示
- 第2章 Numpy入门
本章将介绍Python数据科学领域里最基础的一个库——Numpy,回顾矩阵运算基础,介绍最重要的数据结构Array以及如何通过Numpy进行数组和矩阵运算。
- 2-1 数据科学领域5个常用Python库
- 2-2 数学基础回顾之矩阵运算
- 2-3 Array的创建及访问
- 2-4 数组与矩阵运算
- 2-5 Array的input和output
- 第3章 Pandas入门
本章将介绍Python数据科学领域用于数据分析最重要的一个库——Pandas。将从pandas里最重要的两种数据结构Series和DataFrame开始,介绍其创建和基本操作,通过实际操作理解Series和DataFrame的关系。
- 3-1 Pandas Series
- 3-2 Pandas DataFrame
- 3-3 深入理解Series和Dataframe
- 3-4 Pandas-Dataframe-IO操作
- 3-5 DataFrame的Selecting和indexing
- 3-6 Series和Dataframe的Reindexing
- 3-7 谈一谈NaN
- 3-8 多级Index
- 3-9 Mapping和Replace
- 第4章 Pandas玩转数据
本章是Pandas的进阶。我们会使用Pandas进行高级的数据分析操作,包括如何去做数据清洗、预处理和排序等数学计算,数据的分箱技术,分组技术,聚合技术,以及透视表等。
- 4-1 DataFrame的简单数学计算
- 4-2 Series和DataFrame的排序
- 4-3 重命名Dataframe的index
- 4-4 DataFrame的merge操作
- 4-5 Concatenate和Combine
- 4-6 通过apply进行数据预处理
- 4-7 通过去重进行数据清洗
- 4-8 时间序列操作基础
- 4-9 时间序列数据的采样和画图
- 4-10 数据分箱技术Binning
- 4-11 数据分组技术GroupBy
- 4-12 数据聚合技术Aggregation
- 4-13 透视表
- 4-14 分组和透视功能实战
- 4-15 Streaming DataFrame
- 第5章 绘图和可视化之Matplotlib
数据的可视化是数据分析领域里非常重要的内容。本章会学习Matplotlib的基本使用,包括如何对Pandas里的Series和DataFrame绘图, 以及图形样式和显示模式的设置等内容。
- 5-1 Matplotlib介绍
- 5-2 matplotlib简单绘图之plot
- 5-3 matplotlib简单绘图之subplot
- 5-4 Pandas绘图之Series
- 5-5 Pandas绘图之DataFrame
- 5-6 直方图和密度图
- 第6章 绘图和可视化之Seaborn
Seaborn是对Matplotlib的进一步封装,其强大的调色功能和内置的多种多样的绘图模式,使之成为当下最流行的数据科学绘图工具。本章将介绍Seaborn的基本使用,以及和matplotlib的功能对比。
- 6-1 seaborn介绍
- 6-2 seaborn实现直方图和密度图
- 6-3 seaborn实现柱状图和热力图
- 6-4 seaborn图形显示效果的设置
- 6-5 seaborn强大的调色功能
- 第7章 数据分析项目实战
通过前六章的学习,我们基本上掌握了数据分析领域里主要工具的使用,本章将通过一个股票市场的分析实战项目,和大家一起用学过的知识去分析数据,进而得到有用的信息。
- 7-1 实战准备
- 7-2 股票市场分析实战之数据获取
- 7-3 股票市场分析实战之历史趋势分析
- 7-4 股票市场分析实战之风险分析
- 第8章 课程总结
本章的总结不是对前面8章内容的汇总,而是给大家指明了一条继续学习和锻炼的道路。希望大家坚持练习,早日修成正果。