Pandas beschreiben

Pandas beschreiben

Mit der Funktion pandas beschreiben () können Sie die statistische Zusammenfassung der Daten in Ihrem PANDAS -Datenfream abrufen. Die Funktion gibt statistische Informationen zu den Daten zurück, einschließlich statistischer Mittelwert, Standardabweichung, Min- und Maximalwerte usw.

Funktionssyntax

Die Funktionssyntax ist wie unten gezeigt:

1
Datenrahmen.beschreiben (Perzentile = keine, include = keine, exklude = keine, datetime_is_numeric = false)

Funktionsparameter

Die Funktion akzeptiert die folgenden Parameter:

  1. Perzentile - Ermöglicht Ihnen, ein bestimmtes Perzentil der Daten innerhalb eines Datenrahmens zu erhalten. Der Perzentilwert reicht von 0 bis 1.
  2. enthalten - Gibt eine Liste von Datentypen an, die im Ergebnis mit anerkannten Werten, einschließlich keiner und aller.
  3. ausschließen - Liste der Datentypen, die im Ergebnissatz ausgeschlossen werden sollen.
  4. datetime_is_numeric - Ermöglicht die Funktion, DateTime -Objekte als numerisch zu behandeln.

Funktionsrückgabewert

Die Funktion gibt einen Datenrahmen zurück, wobei jede Zeile den Typ der statistischen Eigenschaft der Spalten enthält.

Beispiel

Betrachten Sie das folgende Beispiel, das die primäre Verwendung der Beschreibung () -Funktion in Pandas zeigt

1
2
3
4
5
6
Pandas als PD importieren
df = pd.DataFrame (
"First_Name": ['Fracis', 'Bernice', 'Debra'],
"Last_name": ['Barton', 'Wyche', 'Wade'],
Index = [1,2,3])
df.beschreiben()

Im obigen Beispiel beginnen wir zunächst die Pandas -Bibliothek importieren. Wir erstellen dann einen einfachen Datenrahmen und rufen die Beschreibung () -Methode auf.

Der obige Code sollte eine grundlegende Informationen zum DataFrame zurückgeben. Ein Beispielausgang ist wie gezeigt

Beachten Sie, wie die Funktion grundlegende statistische Informationen wie die Anzahl der Werte zurückgibt, wie viele eindeutig sind, der Top -Wert usw.

Beispiel #2

Betrachten Sie das Beispiel unten, das die statistische Zusammenfassung einer Pandas -Serie zurückgibt:

1
2
S = PD.Serie ([10,20,30])
S.beschreiben()

In diesem Beispiel sollte die Funktion eine Ausgabe wie gezeigt zurückgeben:

In diesem Fall gibt die Funktion grundlegende Zusammenfassungsinformationen wie den Standardmittelwert, 25., 50. und 75. Perzentile und den Maximalwert in der Serie zurück.

Beispiel #3

Verwenden Sie die Syntax wie unten gezeigt, um eine bestimmte Spalte in einem Pandas -Datenfreame zu beschreiben:

1
Datenrahmen.Spaltenname.beschreiben()

Beispiel #4

Verwenden Sie die gezeigte Syntax, um einen bestimmten Datentyp aus dem Ergebnis auszuschließen:

1
df.beschreiben (ausschließen = [np.Datentyp])

Beispiel Nr. 5

Um alle Spalten in einem Datenrahmen zu beschreiben, unabhängig vom Datentyp, führen Sie den Code aus:

1
df.beschreiben (include = 'alle')

Abschluss

In diesem Artikel haben wir diskutiert, wie die Funktion cribs () in Pandas verwendet wird.