转自:
1.可视化数据
import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt #需要加载这个包df = pd.read_csv('data1.txt', names=['population', 'profit'])#直接给两类命名df.head()df.info()sns.set(context="notebook", style="whitegrid", palette="dark")sns.lmplot('population', 'profit', df, height=6, fit_reg=False)plt.show()#并且需要show一下才可以显示图像
2.seaborn.lmplot函数
It is intended as a convenient interface to fit regression models across conditional subsets of a dataset.
对数据集的条件子集拟合线性回归模型。
//这里的x和y是data中的列名,不是随便设置的。
//控制每个网格的高度。
//如果是true的话,会拟合出一条直线,那么如下:
根据第三个参数进行画图,使用不同的颜色:
tips:数据格式如下:
total_bill tip sex smoker day time size0 16.99 1.01 Female No Sun Dinner 21 10.34 1.66 Male No Sun Dinner 32 21.01 3.50 Male No Sun Dinner 33 23.68 3.31 Male No Sun Dinner 24 24.59 3.61 Female No Sun Dinner 45 25.29 4.71 Male No Sun Dinner 4