So führen Sie den Aggregationsbetrieb mit Groupby Min durch

So führen Sie den Aggregationsbetrieb mit Groupby Min durch
In diesem R -Tutorial werden wir sehen, wie die Aggregationsoperationen durch die Gruppierung der Daten und die Rückgabe der Mindestwerte in den gruppierten Zeilen durchgeführt werden können.

Dieser Vorgang muss auf einem Datenrahmen durchgeführt werden. Erstellen wir den DataFrame mit sieben Zeilen und fünf Spalten.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien',
"USA", "Indien", "Australien"), markt_type = c ("Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft",
"Restaurants", "Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110,342,220,110))
#Display der Marktdatenrahmen
Druck (Markt)

Ergebnis

Jetzt geben wir die Mindestwerte in einer Spalte zurück, indem wir die ähnlichen Werte in einer anderen Spalte gruppieren.

Methode 1: Aggregat ()

Hier verwenden wir die Aggregate () -Funktion, die drei Parameter erfordert.

Syntax

Aggregat (DataFrame_Object $ grupped, list (DataFrame_Object $ grupping), fun = min)

Parameter:

  1. Der erste Parameter übernimmt die variable Spalte (gruppiert), die die Mindestwerte pro Gruppe zurückgibt.
  2. Der zweite Parameter enthält eine einzelne oder mehrere Spalte (Gruppierung) in einer Liste, sodass die Werte in diesen Spalten gruppiert sind.
  3. Der dritte Parameter macht Spaß, wodurch die MIN -Funktion erforderlich ist, um die Mindestwerte in den gruppierten Werten zurückzugeben.

Beispiel 1
In diesem Beispiel gruppieren wir die Werte in der Spalte Market_place und erhalten die Mindestwerte in der Spalte Market_Squarefeet, die nach der Spalte Market_place gruppiert sind.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Geben Sie das Minimum der Quadratfuß in der Gruppe durch Gruppierung markt_place ein
print (aggregiert (markt $ markt_squarefeet, Liste (markt $ markt_place), spaß = min))

Ergebnis

Wir sehen.

Beispiel 2
In diesem Beispiel gruppieren wir die Werte in der Spalte markt_type und erhalten die Mindestwerte in der Spalte Market_Squarefeet, die nach der Spalte Market_type gruppiert sind.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Get The Min of Quadrat Flecken in der Gruppe durch Gruppierung markt_type
print (aggregat (markt $ markt_squarefeet, Liste (markt $ markt_type), fun = min))

Ergebnis

Wir sehen.

Beispiel 3
In diesem Beispiel gruppieren wir die Werte in den Spalten Market_type und Market_place und erhalten die Mindestwerte in der Spalte Market_Squarefeet.

#create einen DataFrame-Market mit 7 Zeilen und 5 Spalten.
Markt = Daten.Frame (markt_id = c (1,2,1,4,3,4,5), markt_name = c ('M1', 'M2', 'M3' ',
'M4', 'M3', 'M4', 'M3'), markt_place = c ('Indien', 'USA', 'Indien', 'Australien', 'USA' ',
'Indien', 'Australien'), markt_type = c ('Lebensmittelgeschäft', 'Bar', 'Grocery', 'Restaurantent',
"Lebensmittelgeschäft", "Bar", "Lebensmittelgeschäft"), Market_Squarefeet = C (120.342,220,110.342,220,110))
#Greifen Sie das Minimum der Quadratfuß in der Gruppe, indem Sie Market_place und Market_Type gruppieren
print (aggregiert (markt $ markt_squarefeet, Liste (markt $ markt_place, markt $ markt_type), spaß = min))

Ergebnis

Wir sehen.

Methode 2: DPLYR

Hier verwenden wir die Funktion von Group_By () mit der Funktion SUMBLISE_AT (), die in der DPLE -Bibliothek verfügbar ist, um die Funktion der Group_By () mit der min -Operation auszuführen.

Syntax

DataFrame_Object%>% Group_by (Gruppierung)%>% summarise_at (vars (gruppiert), list (name = min))

Wo:

  1. Group_By () nimmt einen Parameter, i.e. Gruppierungsspalte
  2. summarise_at () nimmt zwei Parameter vor:
  1. Der erste Parameter übernimmt die variable Spalte (gruppiert), die die Mindestwerte pro Gruppe zurückgibt.
  2. Der zweite Parameter führt die MIN -Funktion durch die Liste.

Schließlich fassen wir zuerst mit der min zusammen und laden sie in die Gruppe. Dann laden wir die gruppierte Spalte in das DataFrame -Objekt.

Es gibt ein Tibble zurück.

Beispiel 1
In diesem Beispiel gruppieren wir die Werte in der Spalte Market_place und erhalten die Mindestwerte in der Spalte Market_Squarefeet, die nach der Spalte Market_place gruppiert sind.

Bibliothek ("Dplyr")
#Geben Sie das Minimum der Quadratfuß in der Gruppe durch Gruppierung markt_place ein
print (markt %> % gruppe_by (markt_place) %> % summarise_at (vars (markt_squarefeet), list (name = min)))

Ergebnis

Wir sehen.

Beispiel 2
In diesem Beispiel gruppieren wir die Werte in der Spalte markt_type und erhalten die Mindestwerte in der Spalte Market_Squarefeet, die nach der Spalte Market_type gruppiert sind.

Bibliothek ("Dplyr")
#Geben Sie das Minimum der Quadratfuß in der Gruppe durch Gruppierung markt_type
print (markt %> % Group_by (markt_type) %> % summarise_at (vars (markt_squarefeet), list (name = min)))

Ergebnis

Wir sehen.

Abschluss

Es ist möglich, die einzelnen oder mehrere Spalten mit den anderen numerischen Spalten zu gruppieren, um den Mindestwert aus der numerischen Spalte mit der Funktion aggregat () zurückzugeben. In ähnlicher Weise können wir die Funciton GroupBy () mit der Funktion summarise_at () verwenden, um die ähnlichen Werte in einer Spalte zu gruppieren und die Mindestwerte aus den gruppierten Werten in Bezug auf eine andere Spalte zurückzugeben.