通过将数据进行可视化操作,数据就变得越来越美丽了
绘图与可视化
- python提供了很多可以制作静态或者动态的可视化文件的库
- python中提供了一个库叫做matplotlib库
- 可视化数据能够直观的展现数据分析的结果
简明的matplotlib入门
图片与子图
matplotlib绘制的图片位于Figure对象中,使用plt.figure生成一个新的图片
通常是不能用新的空白图片进行绘图的,需要使用add_subplot创建一个或者多个子图
说明:也就是Figure对象中可以允许有多个子图
制图的补充说明
获取制图对象
这个时候就可以通过索引方便的获取制图对象、
调整子图之间的间距
颜色,标记和线类型
matplotlib的主函数plot接收带有x和y轴的数组。以及一些可选的字符串缩写参数来指明颜色和线类型
刻度,标签和图例
在pyplot接口设计为交互式使用,包含了像xlim,xticks和xticklabels等方法,分别控制了绘图范围,刻度位置以及刻度标签
设置标题,轴标签,刻度和刻度标签
添加图例
注释与子图加工
在plt中使用text,arrow和annote方法用来添加注释和文本
text方式用于给定坐标x和y并绘制对应的说明
相关示例
注释可以同时绘制文本和箭头,示例中展现标普500指数从2007年以来的收盘价。并标注2008到2009金融危机的重要日期
除此之外还可以绘制多种常见的图形对象
图片保存到文件
使用pandas和seaborn进行绘图
折线图
Series和DateFrame都有一个plot的属性。默认情况下绘制的是折线图
柱状图
bar()和barh()方法分别绘制垂直和水平的柱状图,Series和DataFrame索引将会被用作x的刻度或者是y的刻度
DataFrame
相关示例
* 根据星期日期和派对规模形成交叉表*
使用seaborn进行制图
直方图和密度图
直方图
直方图是一种条形图,用于给出值频率的离散显示,数据点被分成离散的,均匀间隔的箱,并且绘制每个箱中数据点的数量
密度图
密度图是一种与直方图相关的图形列表。通过计算可能产生的观测数据的连续概率分布
一次性绘制直方图和密度图
散点图和点图
散点图和点图可以用于检验两个一维数据序列之间的关系