Pandas gehören zu den beliebtesten Tools, die heute von Datenwissenschaftlern verwendet werden, um tabellarische Daten zu analysieren. Um mit tabellarischen Inhalten umzugehen, bietet es eine schnellere und effektivere API. Wenn wir Datenrahmen während der Analyse anzeigen, legt Pandas automatisch verschiedene Anzeigeverhalten auf Standardwerte fest. Diese Anzeigenverhalten enthalten, wie viele Zeilen und Spalten angezeigt werden sollen, die Genauigkeit von Floats in jedem Datenrahmen, Spaltengrößen usw. Abhängig von den Anforderungen müssen wir gelegentlich diese Standardeinstellungen ändern. Pandas haben eine Vielzahl von Ansätzen, um das Standardverhalten zu verändern. Durch die Nutzung des Attributs "Optionen" von Pandas konnten wir dieses Verhalten ändern.
Pandas zeigen maximale Zeilen an
Immer wenn Sie versuchen, einen riesigen Datenrahmen zu drucken, der mehr Zeilen und Spalten als den vordefinierten Schwellenwert enthält, wird die Ausgabe beschnitten. Um alle Zeilen im DataFrame anzuzeigen, erfahren Sie, wie Sie die Anzeigeoptionen von Pandas in diesem Tutorial ändern können. PANDAS standardmäßig stellen die Anzahl der Spalten und Zeilen, die es zeigt, eine Grenze auf. Dies ist zwar zum Lesen von Inhalten nützlich, verursacht häufig Frustration, wenn die Informationen, die Sie anzeigen müssen, nicht angezeigt werden. Hier werden wir die nachstehend mit ihrer Syntax angegebenen Methoden verwenden, um alle Spalten des DataFrame anzuzeigen.
to_string ()
set_option ()
option_context ()
Wir werden die Verwendung all dieser Methoden mit der praktischen Implementierung lernen, um maximale Zeilen im bereitgestellten Datenrahmen anzuzeigen.
Beispiel Nr. 1: Verwendung von Pandas to_string () Methode
Diese Demonstration lehrt uns, maximale Zeilen in einem Datenrahmen auf dem Terminal anzuzeigen, indem wir die PANDAS -Methode „to_string ()“ verwenden.
Für die Zusammenstellung und Ausführung der Beispielprogramme haben wir das Tool „Spyder“ ausgewählt. In diesem Leitfaden verwenden wir dieses Tool für die Ausführung aller unserer Beispiele. Wir haben das Tool „Spyder“ gestartet, um das Python -Skript zu schreiben. Beginnend mit dem Code müssen wir zuerst die erforderlichen Bibliotheken in unsere Python -Datei laden, damit wir ihre Funktionen verwenden dürfen. Die Modulbibliothek, die wir hier benötigen, ist die „Pandas“. Also haben wir es in unsere Python -Datei importiert und sie in „PD“ veranlasst.
Da der Hauptbetrieb dieses Artikels darin besteht, die maximalen Zeilen eines Datenrahmens anzuzeigen. Es liegt jetzt an Ihnen, ob Sie es vorziehen, einen Datenrahmen zu generieren oder eine CSV -Datei zu importieren. Wir haben eine Beispiel -CSV -Datei importiert. Für das Lesen einer CSV -Datei in das Python -Programm haben wir die Pandas „PD“ verwendet.Read_csv () ”Funktion. Zwischen den Klammern dieser Funktion haben wir die CSV -Datei bereitgestellt, die wir das Display lesen möchten, nämlich „Industrie.CSV ”. Wir haben eine Variable „DF“ erstellt, um die Ausgabe zu speichern, die aus der gelieferten CSV -Datei erzeugt wird. Anschließend haben wir die Methode "print ()" aufgerufen, um den Datenrahmen anzuzeigen.
Wenn wir dieses Python -Programm ausführen, indem wir die Option „Datei ausführen“ durchführen, wird ein Datenrahmen auf der Konsole ausgestellt. Sie können feststellen, dass das Ergebnis unten 43 Zeilen enthält, aber nur zehn angezeigt werden. Dies liegt daran, dass der Standardwert der Pandas Library nur 10 Zeilen beträgt.
Wir werden die Pandas -Methode "to_string" verwenden, um alle Zeilen hier anzuzeigen. Die einfachste Möglichkeit, maximale Zeilen aus einem Datenrahmen zu zeigen, ist diese Technik. Da es jedoch den vollständigen Datenrahmen in eine einzelne Zeichenfolge verwandelt, wird es für sehr große Datensätze (im Millionen) nicht empfohlen, nicht empfohlen wird. Dies funktioniert jedoch effektiv für Datensätze, die in der Länge von Tausenden liegen.
Wir haben die oben angegebene Syntax für die Funktion „to_string ()“ befolgt. Wir haben einfach die Methode „to_string ()“ mit dem Namen unseres Datenrahmens aufgerufen. Dann haben wir diese Methode in die Funktion „print ()“ gesetzt, um sie anzuzeigen, wenn sie aufgerufen werden.
Der Ausgangs -Snapshot zeigt uns einen Datenrahmen, bei dem alle Zeilen auf dem Terminal angezeigt werden.
Beispiel Nr. 2: Verwendung von Pandas set_option -Methode
Die zweite Methode, die wir in diesem Handbuch praktizieren.
In der Python-Datei haben wir die Pandas-Bibliothek importiert, um auf die oben genannte Funktion zuzugreifen. Wir haben die Pandas „PD verwendet.read_csv () “, um die bereitgestellte CSV -Datei zu lesen. Wir haben die „PD angerufen.Read_csv () ”Funktion mit dem Namen der CSV.CSV ”. Beachten Sie beim Importieren der CSV -Datei das aktuelle Arbeitsverzeichnis des Python -Programms. Ihre CSV -Datei muss im selben Verzeichnis platziert werden. Andernfalls erhalten Sie eine Fehlermeldung "Datei nicht gefunden". Wir haben eine Variable „Beispiel“ erstellt, um den Datenrahmen aus der CSV -Datei zu speichern. Wir haben die Methode "print ()" bezeichnet, um diesen Datenrahmen anzuzeigen.
Hier haben wir unsere Ausgabe, bei der nur zehn Zeilen angezeigt werden. Die maximale Anzahl der angegebenen Zeilen beträgt 99. Alle anderen Reihen zwischen den ersten und letzten fünf Zeilen werden abgeschnitten.
Um die maximalen Zeilen zu zeigen, die für diesen Datenrahmen 99 sind, verwenden wir die Funktion „set_option ()“ des Pandas -Moduls. Pandas verfügt über ein Betriebssystem, mit dem Sie das Verhalten und Anzeige ändern können. Mit dieser Methode können wir das Display so einstellen. Pandas geben die Funktion „set_option ()“ zur Anzeige aller Zeilen des Datenrahmens an.
Wir haben die „PD“ angerufen.set_option () ”. Diese Funktion hat Parameter “Anzeige.max_rows ”. Der Bildschirm.max_rows ”gibt die maximale Anzahl von Zeilen an, die bei der Anzeige eines Datenrahmens angezeigt werden. Der Wert von "max_rows" wird standardmäßig auf 10 gesetzt. Wenn 'keine' ausgewählt ist, bedeutet es alle Zeilen im Datenrahmen. Da wir alle Zeilen anzeigen wollen, setzen wir es auf "None",. Zuletzt haben wir die Funktion „print ()“ verwendet, um den Datenrahmen mit maximalen Zeilen anzuzeigen.
Dies ergibt das Ergebnis im folgenden Snapshot.
Beispiel Nr. 3: Verwendung der Methode pandas option_context ()
Die letzte Methode, über die wir hier diskutieren. Dafür haben wir das Pandas -Paket in die Python -Datei importiert und begannen, den Code zu schreiben. Wir haben die „PD“ verwendet.Read_csv () ”Funktion zum Lesen der von uns angegebenen CSV -Datei. Wir haben eine Variable „Dalta“ erstellt, um den Datenrahmen aus der angegebenen CSV -Datei zu speichern. Dann haben wir einfach den DataFrame mit der Methode "print ()" gedruckt.
Das Ergebnis, das wir aus der Ausführung des obigen Code erhalten haben, zeigt uns einen Datenrahmen mit verkürzten Zeilen.
Wir werden jetzt die Pandas „PD anwenden.option_context () ”auf diesem Datenrahmen. Diese Funktion ist identisch mit "set_option ()" ". Der einzige Unterschied zwischen den beiden Ansätzen besteht darin, dass "set_option ()" die Einstellungen dauerhaft ändert, während "Option _context ()" sie gerade in seinem Bereich geändert hat. Diese Methode nimmt auch Anzeige an.MAX -Zeilen als Parameter, den wir auf "None" einstellen, um alle Zeilen des Datenrahmens zu rendern. Nachdem wir diese Funktion aufgerufen haben, haben wir sie gerade durch die Methode „Print ()“ angezeigt.
Hier können wir den vollständigen DataFrame mit seinen maximalen Zeilen anzeigen, die 2747 sind.
Abschluss
Dieser Artikel konzentriert sich auf die Anzeigeoptionen der Pandas. Möglicherweise müssen wir den vollständigen Datenrahmen am Terminal manchmal anzeigen. Pandas geben uns eine Vielzahl von Optionen für diesen Zweck. In diesem Leitfaden haben wir drei dieser Strategien verwendet. Das erste Beispiel basierte auf der Verwendung der Methode "to_string ()". Unsere zweite Instanz lehrt uns, die "set_option ()" zu implementieren, während die letzte Illustration die Methode "option_context ()" ausführt. Alle diese Techniken werden gezeigt, um Sie mit den alternativen Methoden vertraut zu machen, die uns das erforderliche Ergebnis liefern, um das erforderliche Ergebnis zu erzielen.