So führen Sie den Aggregationsbetrieb mit Groupby Sum

So führen Sie den Aggregationsbetrieb mit Groupby Sum
In diesem R -Tutorial werden wir sehen.

Dieser Vorgang muss auf einem Datenrahmen durchgeführt werden. Erstellen wir den DataFrame mit sieben Zeilen und fünf Spalten.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Display der Marktdatenrahmen
Druck (Markt)

Ergebnis

Jetzt werden wir die Gesamtsumme einer Spalte zurückgeben, indem wir die ähnlichen Werte in einer anderen Spalte gruppieren.

Methode 1: Aggregat ()

Hier verwenden wir die Aggregate () -Funktion, die drei Parameter erfordert.

Syntax

Aggregat (DataFrame_Object $ grupped, list (DataFrame_Object $ grupping), fun = sum)

Parameter

  1. Der erste Parameter übernimmt die variable Spalte (gruppiert), die die Wertesumme pro Gruppe zurückgibt.
  2. Der zweite Parameter enthält eine einzelne oder mehrere Spalte (Gruppierung) in einer Liste, sodass die Werte in diesen Spalten gruppiert sind.
  3. Der dritte Parameter macht Spaß, der die Summenfunktion benötigt, um die Gesamtsumme für die gruppierten Werte zurückzugeben.

Beispiel 1
In diesem Beispiel gruppieren wir die Werte in der Spalte Market_place und erhalten die Summe der Werte in der Spalte Market_Squarefeet, die nach der Spalte Market_place gruppiert sind.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Die Summe der Quadratfuß in der Gruppe durch Gruppierung markt_place machen
print (aggregiert (markt $ markt_squarefeet, Liste (markt $ markt_place), spaß = sum)))

Ergebnis

Wir sehen.

Beispiel 2
In diesem Beispiel gruppieren wir die Werte in der Spalte Market_type und erhalten die Summe in der Spalte Market_Squarefeet, die nach der Spalte Market_type gruppiert sind.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Die Summe der Quadratfuß in der Gruppe durch Gruppierung markt_type
print (aggregat (markt $ markt_squarefeet, Liste (markt $ markt_type), fun = sum)))

Ergebnis

Wir sehen.

Beispiel 3
In diesem Beispiel gruppieren wir die Werte in den Spalten Market_Type und Market_place und erhalten die Summe der Werte in der Spalte Market_Squarefeet.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Die Summe der Quadratfuß in der Gruppe durch Gruppierung von Market_place und Market_Type
print (aggregiert (markt $ markt_squarefeet, liste (markt $ markt_place, markt $ markt_type), fun = sum)))

Ergebnis

Wir sehen.

Methode 2: DPLYR

Hier verwenden wir die Funktion Group_By () mit der Funktion SUMPLISE_AT (), die in der DPLE -Bibliothek verfügbar ist, um die Funktion Group_By mit der Summenoperation auszuführen.

Syntax

DataFrame_Object%>% Group_by (Gruppierung)%>% summarise_at (vars (gruppiert), list (name = sum))

Wo:

  1. Group_By () nimmt einen Parameter, i.e. Gruppierungsspalte
  2. summarise_at () nimmt zwei Parameter vor:
  1. Der erste Parameter nimmt die variable Spalte (gruppiert) ein, die die Summe der Werte pro Gruppe zurückgibt.
  2. Der zweite Parameter führt die Summenfunktion durch die Liste.

Schließlich fassen wir zuerst mit der Summe zusammen und laden sie in die Gruppe. Dann laden wir die gruppierte Spalte in das DataFrame -Objekt.

Es gibt ein Tibble zurück.

Beispiel 1
In diesem Beispiel gruppieren wir die Werte in der Spalte Market_place und erhalten die Summe der Werte in der Spalte Market_Squarefeet, die nach der Spalte Market_place gruppiert sind.

Bibliothek ("Dplyr")
#Die Summe der Quadratfuß in der Gruppe durch Gruppierung markt_place machen
drucken (markt %> %Group_by (markt_place) %> %
summarise_at (vars (markt_squarefeet), list (name = sum)))

Ergebnis

Wir sehen.

Beispiel 2
In diesem Beispiel gruppieren wir die Werte in der Spalte markt_type und erhalten die Summe der Werte in der Spalte Market_Squarefeet, die von der Spalte Market_Type gruppiert sind.

Bibliothek ("Dplyr")
#Die Summe der Quadratfuß in der Gruppe durch Gruppierung markt_type
Print (Market %> %Group_by (markt_type) %> %
summarise_at (vars (markt_squarefeet), list (name = sum)))

Ergebnis

Wir sehen.

Abschluss

Es ist möglich, die einzelnen oder mehrere Spalten mit den anderen numerischen Spalten zu gruppieren, um die Summe der numerischen Spalte mit der Funktion aggregat () zurückzugeben. In ähnlicher Weise können wir den GroupBy () Fucniton mit der Funktion SUMBILISE_AT () verwenden, um die ähnlichen Werte in einer Spalte zu gruppieren und die Summe der gruppierten Werte in Bezug auf eine andere Spalte zurückzugeben.