PYSPARK - Show -Methode

PYSPARK - Show -Methode
In Python ist PySpark ein Spark -Modul, mit dem eine ähnliche Art von Verarbeitung wie Spark mit DataFrame bereitgestellt wird. Es enthält die Messe () -Methode, in der der DataFrame in einem tabellarischen Format angezeigt wird.

Syntax:

Datenrahmen.Show (N, vertikal, verkürzt)

Wo DataFrame der Eingabed DataFrame ist

Parameter:

1. N ist der erste optionale Parameter, der den Ganzzahlwert darstellt, um die oberen Zeilen im Datenrahmen zu erhalten, und n repräsentiert die Anzahl der zu angezeigten Top -Zeilen. Standardmäßig werden alle Zeilen aus dem DataFrame angezeigt

2. Der vertikale Parameter nimmt boolesche Werte an, die zum Anzeigen des Datenrahmens im vertikalen Parameter verwendet werden, wenn er auf true eingestellt ist. und Zeigen Sie den DataFrame im horizontalen Format an, wenn er auf false eingestellt ist. Standardmäßig wird es im horizontalen Format angezeigt

3. TRUNCATE wird verwendet, um die Anzahl der Zeichen aus jedem Wert im DataFrame zu erhalten. Es dauert eine Ganzzahl, wie einige Zeichen angezeigt werden müssen. Standardmäßig werden alle Zeichen angezeigt.

Beispiel 1:

In diesem Beispiel erstellen wir einen pyspark -Datenfreame mit 5 Zeilen und 6 Spalten und zeigen den DataFrame mithilfe der Methode show () ohne Parameter an.

Dies führt daher zu einem tabellarischen Datenrahmen, indem alle Werte im DataFrame angezeigt werden

#Amportieren Sie das PySpAPRK -Modul
pysspark importieren
#import SparkSession für die Erstellung einer Sitzung
aus pysspark.SQL Import SparkSession
#create eine App namens LinuxHint
Spark_app = SparkSession.Erbauer.AppName ('LinuxHint').Getorcreate ()
# Erstellen Sie Studentendaten mit 5 Zeilen und 6 Attributen
Studenten = ['Rollno': '001', 'Name': 'Sravan', 'Alter': 23, 'Höhe': 5.79, 'Gewicht': 67, 'Adresse': 'Guntur',
'Rollno': '002', 'Name': 'Ojaswi', 'Alter': 16, 'Höhe': 3.79, 'Gewicht': 34, 'Adresse': 'Hyd',
'Rollno': '003', 'Name': 'Gnanesh Chowdary', 'Alter': 7, 'Höhe': 2.79, 'Gewicht': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Name': 'Rohith', 'Alter': 9, 'Höhe': 3.69, 'Gewicht': 28, 'Adresse': 'Hyd',
'Rollno': '005', 'Name': 'Sridevi', 'Age': 37, 'Höhe': 5.59, 'Gewicht': 54, 'Adresse': 'Hyd']
# Erstellen Sie den Datenrahmen
df = spark_app.Createdataframe (Studenten)
# DataFrame
df.zeigen()

Ausgang:

Beispiel 2:

In diesem Beispiel erstellen wir einen PYSPark -Datenframe mit 5 Zeilen und 6 Spalten und zeigen den DataFrame mit der Methode show () mit dem N -Parameter an. Wir setzen den N -Wert auf 4, um die Top 4 Zeilen aus dem DataFrame anzuzeigen.

Dies führt daher zu einem tabellarischen Datenrahmen, indem 4 Werte im DataFrame angezeigt werden.

#Amportieren Sie das PySpAPRK -Modul
pysspark importieren
#import SparkSession für die Erstellung einer Sitzung
aus pysspark.SQL Import SparkSession
#create eine App namens LinuxHint
Spark_app = SparkSession.Erbauer.AppName ('LinuxHint').Getorcreate ()
# Erstellen Sie Studentendaten mit 5 Zeilen und 6 Attributen
Studenten = ['Rollno': '001', 'Name': 'Sravan', 'Alter': 23, 'Höhe': 5.79, 'Gewicht': 67, 'Adresse': 'Guntur',
'Rollno': '002', 'Name': 'Ojaswi', 'Alter': 16, 'Höhe': 3.79, 'Gewicht': 34, 'Adresse': 'Hyd',
'Rollno': '003', 'Name': 'Gnanesh Chowdary', 'Alter': 7, 'Höhe': 2.79, 'Gewicht': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Name': 'Rohith', 'Alter': 9, 'Höhe': 3.69, 'Gewicht': 28, 'Adresse': 'Hyd',
'Rollno': '005', 'Name': 'Sridevi', 'Age': 37, 'Höhe': 5.59, 'Gewicht': 54, 'Adresse': 'Hyd']
# Erstellen Sie den Datenrahmen
df = spark_app.Createdataframe (Studenten)
# Erhalten Sie die Top 4 Zeilen im DataFrame
df.Show (4)

Ausgang:

Beispiel 3:

In diesem Beispiel erstellen wir einen pyspark -Datenfreame mit 5 Zeilen und 6 Spalten und zeigen den DataFrame mithilfe der messen () -Methode mit einem vertikalen Parameter an. Wir setzen vertikal auf false, um den Datenrahmen in horizontaler Ansicht anzuzeigen.

Dies führt daher zu einem tabellarischen Datenrahmen, indem alle Werte in horizontaler Ansicht angezeigt werden.

#Amportieren Sie das PySpAPRK -Modul
pysspark importieren
#import SparkSession für die Erstellung einer Sitzung
aus pysspark.SQL Import SparkSession
#create eine App namens LinuxHint
Spark_app = SparkSession.Erbauer.AppName ('LinuxHint').Getorcreate ()
# Erstellen Sie Studentendaten mit 5 Zeilen und 6 Attributen
Studenten = ['Rollno': '001', 'Name': 'Sravan', 'Alter': 23, 'Höhe': 5.79, 'Gewicht': 67, 'Adresse': 'Guntur',
'Rollno': '002', 'Name': 'Ojaswi', 'Alter': 16, 'Höhe': 3.79, 'Gewicht': 34, 'Adresse': 'Hyd',
'Rollno': '003', 'Name': 'Gnanesh Chowdary', 'Alter': 7, 'Höhe': 2.79, 'Gewicht': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Name': 'Rohith', 'Alter': 9, 'Höhe': 3.69, 'Gewicht': 28, 'Adresse': 'Hyd',
'Rollno': '005', 'Name': 'Sridevi', 'Age': 37, 'Höhe': 5.59, 'Gewicht': 54, 'Adresse': 'Hyd']
# Erstellen Sie den Datenrahmen
df = spark_app.Createdataframe (Studenten)
# Holen Sie sich den Datenrahmen auf horizontale Weise
df.Show (vertikal = false)

Ausgang:

Beispiel 4:

In diesem Beispiel erstellen wir einen pyspark -Datenfreame mit 5 Zeilen und 6 Spalten und zeigen den DataFrame mithilfe der messen () -Methode mit einem vertikalen Parameter an. Wir setzen vertikal auf True, um den Datenrahmen in vertikaler Ansicht anzuzeigen.

Dies führt daher zu einem tabellarischen Datenrahmen, indem alle Werte in vertikaler Ansicht angezeigt werden.

#Amportieren Sie das PySpAPRK -Modul
pysspark importieren
#import SparkSession für die Erstellung einer Sitzung
aus pysspark.SQL Import SparkSession
#create eine App namens LinuxHint
Spark_app = SparkSession.Erbauer.AppName ('LinuxHint').Getorcreate ()
# Erstellen Sie Studentendaten mit 5 Zeilen und 6 Attributen
Studenten = ['Rollno': '001', 'Name': 'Sravan', 'Alter': 23, 'Höhe': 5.79, 'Gewicht': 67, 'Adresse': 'Guntur',
'Rollno': '002', 'Name': 'Ojaswi', 'Alter': 16, 'Höhe': 3.79, 'Gewicht': 34, 'Adresse': 'Hyd',
'Rollno': '003', 'Name': 'Gnanesh Chowdary', 'Alter': 7, 'Höhe': 2.79, 'Gewicht': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Name': 'Rohith', 'Alter': 9, 'Höhe': 3.69, 'Gewicht': 28, 'Adresse': 'Hyd',
'Rollno': '005', 'Name': 'Sridevi', 'Age': 37, 'Höhe': 5.59, 'Gewicht': 54, 'Adresse': 'Hyd']
# Erstellen Sie den Datenrahmen
df = spark_app.Createdataframe (Studenten)
# Holen Sie sich den Datenrahmen auf vertikale Weise
df.Show (vertikal = true)

Ausgang:

Beispiel 5:

In diesem Beispiel erstellen wir einen PYSPark -Datenfreame mit 5 Zeilen und 6 Spalten und zeigen den DataFrame mit der Methode show () mit dem Parameter von Sendung () an. Wir setzen den Kürzungswert auf 1, um das erste Zeichen in jeder Zeile des Datenrahmens anzuzeigen.

Dies führt also zu einem tabellarischen Datenrahmen, indem das erste Zeichen in horizontaler Ansicht angezeigt wird.

#Amportieren Sie das PySpAPRK -Modul
pysspark importieren
#import SparkSession für die Erstellung einer Sitzung
aus pysspark.SQL Import SparkSession
#create eine App namens LinuxHint
Spark_app = SparkSession.Erbauer.AppName ('LinuxHint').Getorcreate ()
# Erstellen Sie Studentendaten mit 5 Zeilen und 6 Attributen
Studenten = ['Rollno': '001', 'Name': 'Sravan', 'Alter': 23, 'Höhe': 5.79, 'Gewicht': 67, 'Adresse': 'Guntur',
'Rollno': '002', 'Name': 'Ojaswi', 'Alter': 16, 'Höhe': 3.79, 'Gewicht': 34, 'Adresse': 'Hyd',
'Rollno': '003', 'Name': 'Gnanesh Chowdary', 'Alter': 7, 'Höhe': 2.79, 'Gewicht': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Name': 'Rohith', 'Alter': 9, 'Höhe': 3.69, 'Gewicht': 28, 'Adresse': 'Hyd',
'Rollno': '005', 'Name': 'Sridevi', 'Age': 37, 'Höhe': 5.59, 'Gewicht': 54, 'Adresse': 'Hyd']
# Erstellen Sie den Datenrahmen
df = spark_app.Createdataframe (Studenten)
# Erhalten Sie den Datenrahmen, indem Sie nur den ersten Charakter in jeder Zeile erhalten
df.Show (truncate = 1)

Ausgang:

Abschluss

In diesem Artikel wurde die Show () -Methode in PySpark und seine Funktionalität erörtert. Wir haben alle Parameter mit Werten für den DataFrame berücksichtigt.