SQL -Aussagen für Datenwissenschaftler

SQL -Aussagen für Datenwissenschaftler
SQL steht für strukturierte Programmiersprache. Es ist eine einfache Abfragesprache, mit der Sie die Daten aus einer Datenbank verwalten können.

Eine Datenbank ist eine Sammlung von Daten, die in einem Computersystem gespeichert sind. SQL ist eine der universellsten Programmiersprache, die Tausende von Funktionen ausführen kann, darunter das Lesen, Schreiben und Manipulieren von Daten.

Es ist die Standardprogrammiersprache für die Verwaltung relationaler Datenbanken und wird von Informatikern, Datenanalysten und Datenwissenschaftlern auf der ganzen Welt verwendet.

In diesem Leitfaden werden wir SQL -Anweisungen oder Abfragen durchgehen, die in der Datenwissenschaft ausgiebig verwendet werden.

In diesem Handbuch werden PostgreSQL -Software verwendet, um die Abfragen auszuführen. Sie können es von der offiziellen Website herunterladen, indem Sie hier klicken.

Wenn das gesagt ist, beginnen wir, beginnen wir!1

1. Auswählen aller Spalten

Die Auswahlanweisung ist eine der grundlegendsten SQL -Abfragen. Diese Anweisung hilft Ihnen, einige oder alle Spalten aus der Datenbank auszuwählen. Sie werden diese Funktion in Ihren Datenwissenschaftsprojekten verwenden.

Um alle Spalten auszuwählen, verwenden Sie '*', wie im folgenden Beispiel gezeigt:

„Produkt“ ist eine Tabelle, die aus 3 Spalten besteht. Nachdem wir die vorherige Abfrage ausgeführt haben.

2. Aus Klausel

Aus der Klausel erfolgt nach dem Auswahl und hilft zu ermitteln, wo sich die Spalte in der Tabelle mit Namen befindet.

Verwenden Sie bei der Angabe mehrerer Tabellen Kommas und Platz zwischen den Tabellennamen. Dies wird im folgenden Beispiel angezeigt:

Die Ausgabe ist spezifischer mit nur einer Spalte. Dies ist im Folgenden dargestellt:

3. Wo Klausel

Die nächste Aussage danach ist woher. Es hilft uns, die Daten aus der Datenbank basierend auf bestimmten Bedingungen zu filtern.

Ausgang:

4. Gruppe nach Erklärung

Diese Klausel wird verwendet, um die Zeilen auszuwählen und zu gruppieren, die die gleichen Werte haben.

In der angegebenen SQL -Abfrage werden wir zwei Zeilen gruppieren, wo das protrot_price gleich 6 ist.

Die Ausgabe hat eine neue Spalte mit dem Namen Count. Es folgt die Spalte product_name, wie in Folgendes gezeigt:

5. Aussage haben

Aggregationsfunktionen wie Summe, AVG, Max, Min usw. kann nicht in der Where -Klausel verwendet werden. Um sie zu verwenden, müssen Sie die Anweisung verwenden. Dies wird mit Hilfe des folgenden Code gezeigt:

Ausgang:

6. Bestellung durch Erklärung

Wie aus dem Namen wird der Befehl bestellen, um die Datensätze in aufsteigender oder absteigender Reihenfolge aufzulisten. Verwenden Sie zum Aufstieg die Bestellung alleine oder fügen Sie das Schlüsselwort "ASC" hinzu. Verwenden Sie in ähnlicher Weise, um die Werte in absteigender Reihenfolge zu sortieren, das Schlüsselwort „Desc“ zusammen mit der Bestellung nach.

Für absteigende Reihenfolge:

Ausgang:

Ebenso für aufsteigende Reihenfolge:

Ausgang:

7. Begrenzungserklärung

Limit ist eine wichtige SQL -Anweisung, mit der Sie die Anzahl der Datensätze angeben können, die aus der Datenbank zurückgegeben werden sollen. Verwenden Sie beispielsweise nur zwei Zeilen aus unserer Datenbank, um den Befehl Limit wie folgt zu verwenden:

Ausgang:

8. Vordefinierte Datenfunktionen

Vordefinierte Funktionen sind in SQL sehr wichtig, da sie den Datenwissenschaftlern helfen, Zeit zu sparen. Diese Funktionen werden auch als Aggregatfunktionen bezeichnet, die auf einer Reihe von Zeilen anstelle einer einzelnen Zeile funktionieren und einen einzelnen Wert zurückgeben. Es gibt viele verschiedene Gesamtfunktionen. Einige wichtige sind im Folgenden aufgeführt:

Zählen (*) -> Gibt die Anzahl der Zeilen zurück.

Min () -> findet den Mindestwert in der Spalte.

Max () -> findet den Maximalwert in der Spalte.

Sum () -> Die Summe aller Werte innerhalb des Spaltennamens.

Was ist der maximale Preis in unserer Datentabelle??

Ausgang:

9. Innere, linke und rechte Verbindungen

Es gibt viele Arten von Verknüpfungen, aber die drei wichtigsten werden hier besprochen.

Der innere Jou.

Ausgang:

Der linke Join gibt alle Zeilen in der linken Spalte und die übereinstimmenden Zeilen in der rechten Spalte zurück.

Ausgang:

Hier haben wir uns der Spalte product_profit aus Tabelle2 mit der Spalte product_name in Tabelle 1 angeschlossen.

Die rechte Verbindung ist das Gegenteil der linken Verbindung. Es gibt alle in der rechten Spalte vorhandenen Zeilen und die übereinstimmenden Zeilen in der linken Spalte zurück.

10. Unterabfragen

Last but not least haben wir Unterabfragen, die auch als innere Abfrage bezeichnet werden. Es ist in einer größeren Abfrage verschachtelt, die entweder innerhalb der Auswahl, aus oder in der Klausel auftreten kann.

Eine Unterabfrage ist nicht auf diese Klauseln beschränkt. Es kann auch in anderen Klauseln wie Löschen, Einfügen oder Update auftreten.

Ein weiteres wichtiges Merkmal der Unterabfrage ist, dass Sie die logischen Operatoren wie> verwenden können, <, or =. A subquery is also executed first before its parent query.

Zum Beispiel:

Ausgang:

Abschluss

In diesem Artikel haben wir die wichtigen SQL -Abfragen für Datenwissenschaftler durchgesehen. Diese Abfragen sind sehr häufig und können von Fachleuten wie Dateningenieuren, Datenanalysten usw. verwendet werden. Der beste Weg, all diese Abfragen zu lernen, besteht darin, Ihre eigene Datenbank zu erstellen und dann so viel wie möglich zu üben. Mit diesem Leitfaden als Fundament können Sie nun mehr erweiterte Abfragen für Data Science kennenlernen.