Pandas las SQL

Pandas las SQL

Python enthält die "Pandas" -Bibliothek zur Analyse und Manipulation der Daten. "SQL" wird für die Kommunikation mit der Datenbank verwendet. Wir können auch die „strukturierte Abfragesprache“ in „Pandas“ lesen. In SQL werden die Daten für die langfristige Verwendung in Form von Tabellen gespeichert. Wir können die SQL -Tabellen einfach erstellen und diesen Tabellen Daten hinzufügen. Wir können auch die SQL -Datenbankdaten in „Pandas“ lesen oder zugreifen. Wir werden verschiedene Möglichkeiten zum Lesen der SQL -Daten in „Pandas“ in diesem Handbuch anwenden. In dieser Anleitung dreht sich alles um die "Read SQL" in "Pandas". Wir werden die „PANDAS“ -Methoden verwenden, um die SQL -Tabelle zu lesen und die SQL -Tabellendaten in Form von DataFrame in „Pandas“ in diesem Handbuch darzustellen.

"Pandas" -Methoden zum Lesen des SQL

Wir haben drei Techniken zum Lesen der SQL -Daten in „Pandas.Hier werden wir alle drei Ansätze in diesem Leitfaden abdecken. Diese Methoden sind:

  • Read_SQL () Methode
  • Read_SQL_Query () Methode
  • read_sql_table () Methode

Jetzt verwenden wir diese Methoden in „Pandas“, um die SQL -Tabellendaten in diesem Handbuch zu lesen. Die Beispiele werden auch im folgenden Hinweis hinzugefügt, an dem wir diese Methoden anwenden werden.

Beispiel 1:

Wir erstellen die SQL -Datenbank und erläutern die Methoden, wie wir sie erstellen. Wir importieren hier den „SQLite3“, um auf die Module des „SQLite3“ zuzugreifen. Anschließend erstellen wir die Variable "my_conn" und verbinden sie mit "Connect ()" mit der Datenbank. ". Der Name der Datenbank, die wir erstellt haben, lautet "writers_database". Wir platzieren den "SQLite3" mit dem "Connect ()", da es die Methode des "SQLite3" ist, auf den wir hier zugegriffen haben.

Danach platzieren wir die Methode „Cursor ()“ mit dem von uns erstellten variablen Namen und speichern sie in der Variablen „my_c“. Danach erstellen wir die Tabelle "Autoren", in der der "writer_id" als "Primärschlüssel" festgelegt ist und der Zapfendatentyp ist. Dann fügen wir den "writer_name und writer_type" hinzu. Beide sind der Datentyp "Text". Wir fügen auch die "Working_Days und bezahlen" des Datentyps "Ganzzahl" hinzu. Danach fügen wir die Daten in die Tabelle „Autoren“ ein.

Wir fügen die Namen der Spalten hinzu, die wir zuvor erstellt haben. Dann platzieren wir die „Werte“, in denen wir die Werte eingeben. Wir geben „1, Stephen, technischer Autor, 4, 80000“, der erste Aufzeichnung dieser "Autoren" -Tabelle. Dann fügen wir "2, Peter, akademischer Schriftsteller, 5, 70000" als zweite Aufzeichnung der SQL -Tabelle hinzu. Wir fügen auch "3, William, Blogs Writer, 6, 30000" und "4, David, Technical Writer, 6, 450000" hinzu. Dann fügen wir auch "5, Charlie, Artikelautorautor, 5, 150000" als fünfte Aufzeichnung hinzu. Danach verwenden wir die "Commit ()" ". Jetzt werden die Datenbank „Autoren“ erstellt. Wir verwenden die „Pandas“ -Methoden, um diese SQL -Daten zu lesen.

Wir importieren das „SQLite3“ in dieser neuen Datei, um in diesem Code auf die Module und Funktionen zugreifen zu können. Wir importieren auch die "Pandas" -Module hier. Jetzt können wir die Methoden oder Funktionen von „SQLite3“ und „Pandas“ leicht anwenden. Wir fügen die Variable "my_conn" hinzu und initialisieren diese "my_conn" mit der "SQLite3" -Methode "connect ()". Wir verbinden es mit der zuvor erstellten „writers_database“. Danach verwenden wir die „PD.Read_SQL () ”Methode zum Lesen der Daten der SQL -Datei. Wir platzieren "PD", da es die Methode der "Pandas" ist. Wir fügen die Abfrage in IT hinzu, die die "SELECT * von Schriftstellern" ist, die alle Daten der Tabelle "Autoren" auswählt und die Daten des SQL in der Variablen "SQL_QUERY" speichert.

Wir platzieren auch die Variable "my_conn" in dieser Funktion, die bei der Verbindung mit der Datenbank "Autoren" hilft. Anschließend konvertieren wir die Daten mit dem „PD.DataFrame () ”Methode. Wir übergeben die Variable "SQL_Query", in der die Daten des SQL gespeichert sind. Wir fügen auch die Spaltennamen ein. Wir fügen dieselben Spaltennamen hinzu, die wir in der SQL -Datenbank geschrieben haben.

Anschließend verwenden wir die "print ()" und übergeben die "SQL_DF", damit die Daten der SQL in Form des Datenrahmens druckt, wenn wir dieses Programm ausführen.

Drücken Sie das Symbol "Ausführen" und erhalten Sie das Ergebnis des Codes. Alle Daten der Datenbank „Autoren“ werden hier als Datenrahmen angezeigt.

Beispiel 2:

In diesem Beispiel lesen wir die Daten aus dem SQL mit der „PD.read_sql_query () ”Methode. Wir fügen dieselbe Abfrage hinzu, die wir zuvor hinzugefügt haben, um alle Daten des SQL zu erhalten. Wir ändern die Methode in diesem Code, um die Daten des SQL zu lesen. Wir ändern auch die Daten des SQL im DataFrame mit Hilfe der „Pandas“ -Methode und drucken sie dann hier aus.

Sie können hier die gleiche Ausgabe beachten. Das Ergebnis, das wir nach der Anwendung beider Methoden erhalten, ergibt das gleiche Ergebnis hier.

Beispiel 3:

Jetzt wenden wir die Methode "Read_SQL_Table ()" an. Wir müssen die Abfrage in dieser Methode nicht hinzufügen. Wir platzieren einfach die Methode "read_sql ()". In dieser Methode fügen wir einfach den Namen der SQL -Tabelle hinzu, um die Daten des SQL zu extrahieren. Anschließend konvertieren wir diese SQL -Daten in den Datenrahmen mit „PD.DataFrame ”und fügen Sie den" SQL_Query "als erster Parameter hinzu. Außerdem fügen wir die Namen von Spalten in "Namen" hinzu. Anschließend rendern wir den Datenrahmen, der in der Variablen „Daten“ gespeichert ist, indem diese Variable in "print ()" im Folgenden hinzugefügt wird:

Wenn dieser Code ausgeführt wird, ist die identische Ausgabe sichtbar. Hier liefert das Ergebnis der Verwendung aller drei Ansätze das gleiche Ergebnis. Hier erhalten wir den gesamten Datenrahmen, wenn wir in den vorherigen Codes darauf zugegriffen haben.

Beispiel 4:

Wir können auch einige Bedingungen anwenden, während wir auf die Daten aus dem SQL zugreifen. Wir werden zeigen, wie wir die gewünschten Daten aus dem SQL erhalten und sie drucken. Hier machen wir nicht die gesamten Daten der SQL -Tabelle. Wir verwenden die Methode "Read_SQL_Query ()" hier, bei der wir die "Select * von Autoren" platzieren und eine Bedingung hinzufügen, die "Pay = 70000" lautet. Es wird nur auf die Spalten zugreifen, in denen die Bezahlung der Autoren „70000“ beträgt und nicht die gesamte SQL -Tabelle erhält. Dies greift auf diese Zeilen zu, in denen wir in der Spalte „Pay“ der SQL -Tabelle „70000“ hinzufügen. Wir wandeln diese Zeilen auch in den Datenrahmen um und rendern sie in der Ausgabe.

Wir erhalten hier nur eine Zeile, da nur eine Zeile des DataFrame "70000" in der Spalte "Pay" enthält. Es greift nur auf diese Reihe zu und zeigt sie am Terminal an. Es wurde nicht die gesamte SQL -Tabelle angezeigt, da wir die Bedingung in der Abfrage des SQL hinzugefügt haben.

Abschluss

Wir haben die SQL -Tabelle in „Pandas“ in diesem Handbuch erfahren. Wir haben besprochen, wie man die SQL -Datenbanktabelle erstellt und wie man diese SQL -Tabelle in "Pandas" liest. Wir haben erklärt, dass das „Pandas“ drei Methoden hat, die uns beim Lesen der SQL -Tabelle helfen. Wir haben alle Ansätze untersucht, die beim Lesen des SQL in „Pandas“ helfen, das SQL zu lesen. Wir haben die Codes illustriert, in denen wir das SQL in „Pandas“ lesen,. Wir haben auch die Ergebnisse dieser Codes gezeigt. Wir haben erklärt, wie wir die ausgewählten Daten aus der SQL -Tabelle erhalten. Wir haben die SQL -Daten in Form von "Pandas" -Datenframe in diesem Handbuch gemacht und sie ausführlich erläutert.