1.前言
我们同时用Python和Excel如何对筛选数据求和、求均值计算,以筛选2019年数据为例,对筛选完的数据的label列进行部分求和及求均值。完整代码如下所示。
# Python对筛选的数据进行求和、求均值计算? | Python VS Excel
# 设我们要筛选中2019年的日期,即[2019, 2020),并对label求和及均值
importpandasaspd
datapdread_csv'./商品需求训练集.csv'
data1datadata"date">"2019"&data"date"<"2020"
sum1datadata"date">"2019"&data"date"<"2020"labelsum
average1datadata"date">"2019"&data"date"<"2020"labelmean
sum1average1
2.具体操作
那么首先把数据加载到data里面,代码如下所示。
# Python对筛选的数据进行求和、求均值计算? | Python VS Excel
# 设我们要筛选中2019年的日期,即[2019, 2020),并对label求和及均值
importpandasaspd
datapdread_csv'./商品需求训练集.csv'对数据进行筛选,其中data1表示满足筛选条件的部分数据,这个条件(data["date"]>"2019") & (data["date"]<"2020")就是说在2019和2020年之间的那些数据;
data1datadata"date">"2019"&data"date"<"2020"筛选出来之后,如果你想要求部分数据的和,只要.label()方法,因为我们这样是求label列的总和,所以是先.label()方法,然后再.sum()方法,如果你要求均值呢,就是点label,然后再调用.mean()函数求得结果,放在sum1和average1;
sum1datadata"date">"2019"&data"date"<"2020"labelsum
average1datadata"date">"2019"&data"date"<"2020"labelmean
sum1average1
具体结果如下所示,这个结果呢,跟我们在excel里面筛选求均值和求和的是一样的,我们同样也会给大家讲解;

我们首先是对date进行筛选了的,我们放大查看一下结果,date里面的筛选条件就是说,大于日期2019,小于日期2020;

然后使用SUBTOTAL方法来对筛选得到的数据进行求和和求均值,我们看到这个函数,第一个参数9表示求和,后面的这个范围呢就是被筛选出来的数据的范围,即可求到部分筛选值的和;

求均值对应的公式呢是这样的,1表示调用求均值方法,范围还是这样的,就可以得到部分数据的均值;

最终可知,这两个结果和Python里面的结果对应上的。
