Mit der Funktion pandas beschreiben () können Sie die statistische Zusammenfassung der Daten in Ihrem PANDAS -Datenfream abrufen. Die Funktion gibt statistische Informationen zu den Daten zurück, einschließlich statistischer Mittelwert, Standardabweichung, Min- und Maximalwerte usw.
Funktionssyntax
Die Funktionssyntax ist wie unten gezeigt:
1 | Datenrahmen.beschreiben (Perzentile = keine, include = keine, exklude = keine, datetime_is_numeric = false) |
Funktionsparameter
Die Funktion akzeptiert die folgenden Parameter:
Funktionsrückgabewert
Die Funktion gibt einen Datenrahmen zurück, wobei jede Zeile den Typ der statistischen Eigenschaft der Spalten enthält.
Beispiel
Betrachten Sie das folgende Beispiel, das die primäre Verwendung der Beschreibung () -Funktion in Pandas zeigt
1 2 3 4 5 6 | Pandas als PD importieren df = pd.DataFrame ( "First_Name": ['Fracis', 'Bernice', 'Debra'], "Last_name": ['Barton', 'Wyche', 'Wade'], Index = [1,2,3]) df.beschreiben() |
Im obigen Beispiel beginnen wir zunächst die Pandas -Bibliothek importieren. Wir erstellen dann einen einfachen Datenrahmen und rufen die Beschreibung () -Methode auf.
Der obige Code sollte eine grundlegende Informationen zum DataFrame zurückgeben. Ein Beispielausgang ist wie gezeigt
Beachten Sie, wie die Funktion grundlegende statistische Informationen wie die Anzahl der Werte zurückgibt, wie viele eindeutig sind, der Top -Wert usw.
Beispiel #2
Betrachten Sie das Beispiel unten, das die statistische Zusammenfassung einer Pandas -Serie zurückgibt:
1 2 | S = PD.Serie ([10,20,30]) S.beschreiben() |
In diesem Beispiel sollte die Funktion eine Ausgabe wie gezeigt zurückgeben:
In diesem Fall gibt die Funktion grundlegende Zusammenfassungsinformationen wie den Standardmittelwert, 25., 50. und 75. Perzentile und den Maximalwert in der Serie zurück.
Beispiel #3
Verwenden Sie die Syntax wie unten gezeigt, um eine bestimmte Spalte in einem Pandas -Datenfreame zu beschreiben:
1 | Datenrahmen.Spaltenname.beschreiben() |
Beispiel #4
Verwenden Sie die gezeigte Syntax, um einen bestimmten Datentyp aus dem Ergebnis auszuschließen:
1 | df.beschreiben (ausschließen = [np.Datentyp]) |
Beispiel Nr. 5
Um alle Spalten in einem Datenrahmen zu beschreiben, unabhängig vom Datentyp, führen Sie den Code aus:
1 | df.beschreiben (include = 'alle') |
Abschluss
In diesem Artikel haben wir diskutiert, wie die Funktion cribs () in Pandas verwendet wird.