最近小伙伴提出了幾個問題,如何用pandas實現execl中的匯總行。
關于這個問題,群里展開了激烈的討論,最終經過梳理總結出了以下兩個解決方法。一種是當做透視時直接使用參數margins
,另一種是當無透視時手動造出匯總行。
pivot_table
問題(群成員"浮生如夢"):
我想統計一月到十二月的所有數據應該怎么寫呢?
解決方法
- 用法:
sum()
、pivot_table
如果要對數據按行方向求和,直接使用sum()
函數即可,設置參數axis=1
(默認是axis=0列方向對列數據求和),然后將橫向求和結果賦給一個新的字段。此例中為求和,其他統計方式如mean、max、min等均同理。
# 生成測試數據
df = pd.DataFrame(np.random.randint(10,100,(9,12)),
columns=['JAN','FEB','MAR','APR','MAY','JUN','JUL','AUG','SEP','OCT','NOV','DEC'])
# 橫向求和
df['total'] = df.sum(axis=1)
此時已得到行方向的求和,如果我們想繼續計算列方向求和并顯示出來如何操作呢?可以借助pivot_table
來實現,設置參數margins=True
。
pd.pivot_table(df, index=df.index, aggfunc='sum', margins=True)
groupby+concat
問題(群成員"張晶"):
pandas里面如何實現類似excel中的匯總行?
kv = {'Name': {0: 'John', 1: 'Mack', 2: 'Lilei', 3: 'Kevin', 4: 'Alin', 5: 'Bob'},
'Team': {0: 'A', 1: 'A', 2: 'B', 3: 'B', 4: 'C', 5: 'C'},
'Jan': {0: 9, 1: 9, 2: 8, 3: 10, 4: 7, 5: 9},
'Feb': {0: 10, 1: 7, 2: 8, 3: 7, 4: 6, 5: 8},
'Mar': {0: 8, 1: 9, 2: 7, 3: 8, 4: 8, 5: 7},
'Apri': {0: 8, 1: 7, 2: 6, 3: 7, 4: 6, 5: 8}}
df = pd.DataFrame(kv)
解決方法
用法:groupby
、concat
、sum
、transform
該方法通過幾種用法的組合間接實現了行和列數據匯總。
- 對列數據的匯總求和比較取巧,使用
groupby
實現了對整列數據求和,求和sum
函數中需設置numeric_only
參數,只對數值求和。得到列匯總結果后將其與原數據進行concat
縱向拼接。 - 對行數據求和可以直接使用
sum
函數,通過axis=1
指定橫向求和。
# 增加列匯總數據
total = df.groupby(lambda _: '總計').sum(numeric_only=True)
# 與原數據縱向拼接
df_total = pd.concat([df,total]).fillna('/')
# 對原數據數值類型橫向求和
df_total['total'] = df_total.sum(numeric_only=True,axis=1)
df_total
如果想要對Team進行分組求和,可以通過transform
實現組合求和并添加為一個新的求和列。
# 分組內求和
df_total['team_total'] = df_total.groupby(['Team'])['total'].transform('sum')
df_total
以上是本次分享內容。
-
數據
+關注
關注
8文章
7118瀏覽量
89342 -
參數
+關注
關注
11文章
1854瀏覽量
32354 -
execl
+關注
關注
0文章
2瀏覽量
2230
發布評論請先 登錄
相關推薦
評論