Rotverschiebung mittlere Funktion

Rotverschiebung mittlere Funktion
Der Median ist ein unkompliziertes und gemeinsames Konzept in Statistik und Wahrscheinlichkeit. Die Schüler im Zusammenhang mit solchen mathematischen Feldern sind mit ihrer Verwendung vertraut und wie man sie verbal berechnet. Es ist einfach der mittlere Wert in einem angeordneten Datensatz. Wenn Sie den Median eines Satzes finden möchten, ordnen Sie einfach die Werte in aufsteigender oder absteigender Reihenfolge an und wählen Sie den mittleren Wert daraus.

Es gibt zwei verschiedene Szenarien, während der Median eines Datensatzes berechnet wird:

  • Sie haben eine ungerade Anzahl von Werten in unserem Datensatz
  • Sie haben eine gleichmäßige Anzahl von Werten in unserem Datensatz

Wenn Sie eine ungerade Anzahl von Werten haben, ist die Lösung einfach und Sie können die mittlere Zahl leicht finden.

Wenn Sie versuchen, den Median für eine gleichmäßige Anzahl von Werten zu finden, müssen Sie den Mittelwert oder den Durchschnitt der beiden mittleren Zahlen einnehmen. Mit anderen Worten, Sie müssen die beiden Werte hinzufügen, die in der Mitte des Datensatzes liegen und ihre Summe durch zwei teilen.

In diesem Artikel konzentrieren wir uns darauf, wie Sie den Median eines Datensatzes in Ihrer Amazon Redshift -Datenbank finden können. RedShift ist ein sehr berühmter AWS Data Warehousing -Service für die Lösung komplexer Datenbankabfragen und das Ausführen von Big Data -Analyse -Jobs.

Syntax, um die Medianfunktion zu verwenden

Wenn Sie mit RedShift arbeiten, können Sie den Median eines Datensatzes leicht mit der folgenden Syntax finden:

MEDIAN ( )

Hier das mittlerer Ausdruck ist einfach der Datensatz oder der Spaltenname, für den Sie den Median finden möchten.

Beispiele für die Verwendung der mittleren Funktion

Nehmen wir nun ein Beispiel, in dem Sie den Median für das Alter der Schüler in der Klasse finden möchten. Sie haben einen Tisch class_data mit zwei Spalten Name Und Alter im Rotverschiebungscluster.

Wir haben zufällige und ungeordnete Daten und möchten den Median dieser Daten. Um den Median für einen solchen Datensatz zu finden, schreiben Sie die folgende Abfrage in Rotverschiebung:

Median auswählen (Alter)
Von Organisation.class_data

Die Abfrage ist einfach und kurz, aber sie gibt den Median des Datensatzes zurück, der über den Eingabegleitpunkt zur Verfügung gestellt wird. Die mittlere Funktion kann nur ein kleiner Teil vieler komplexer Abfragen in schwierigen Datenanalysen und statistischen Jobs sein.

Sie haben gesehen, wie man den Median einer Spalte zu einer bestimmten Datenbanktabelle findet. Gehen wir zu einem höheren Niveau und sehen Sie, wie die mittlere Funktion in komplexen Rotverschiebungsanfragen verwendet werden kann.

Bedingter Fall

Hier sehen Sie, wie Sie eine bedingte Aussage hinzufügen können, während Sie versuchen, einen Median eines Datensatzes zu finden. Angenommen, Sie arbeiten als IT -Spezialist in der Vertriebs- und Umsatzabteilung Ihrer Organisation. Ihr oberes Management wird eine Aufgabe zugewiesen, um den Median für die Projekte zu finden, die mehr als tausend Dollar kosten.

Sie wissen bereits, wie man den Median für diese Spalte findet. Aber hier ist unsere Anforderung etwas anders, deshalb verwenden Sie die folgende Abfrage, um die gewünschten Ergebnisse zu erzielen:

Median auswählen (Kosten)
von Organisation.Projekte
wo Kosten> 1000

Sie werden die folgende Ausgabe aus dieser Abfrage erhalten. Der Median, den wir erhalten haben, wird berechnet, nachdem alle Werte von ignoriert wurden kosten weniger als tausend.

Auf diese Weise können Sie die Medianfunktion mit einer bedingten Grenze nutzen, um Ihre erforderlichen Ergebnisse in der Rotverschiebungsdatenbank zu erhalten.

Median Fensterfunktion

Falls Sie mit Fensterfunktionen nicht vertraut sind, werden sie verwendet, wenn Sie die Funktion nicht in der gesamten Datenbanktabelle oder -spalte anwenden möchten. Mit den Fensterfunktionen können Sie eine Funktion auf einem Satz oder einer bestimmten Gruppe oder einem Datenbereich anwenden. Jede Gruppe gibt ihr Ergebnis für diese bestimmte Funktion in einer einzelnen Ausgabe zurück. Für viele SQL -Funktionen finden Sie in Amazon Redshift entsprechende Fensterfunktionen für viele SQL -Funktionen.

Angenommen, Sie werden ein neues Projekt starten, aber Ihrem Unternehmen fehlen einige der Fähigkeiten, um dieses Projekt abzuschließen. Aus diesem Grund möchten Sie einen Teil des Teils des Projekts auslagern, für das Sie einige andere Organisationen haben, die Ihnen Zitate für dieses Outsourcing -Projekt zur Verfügung stellen. Jeder Kunde hat drei verschiedene Ausführungspläne entwickelt, aus denen Sie eine auswählen müssen.

Jetzt müssen Sie für jeden Kunden mit einem moderaten Plan entscheiden. Um die Lösung zuerst zu finden, finden Sie den Median für jeden Kunden getrennt. Wir werden die Median -Fensterfunktion für diese Aufgabe verwenden.

Wählen Sie Client_Name, Project_type, Median (Quotation_Value) aus
Over (Partition von Client_Name)
von Organisation.Kunden
bestellen by client_name;

In der Ausgabe erhalten Sie die folgenden Ergebnisse. Der Median für jeden Kunden wird berechnet und separat mit dem angezeigt ÜBER Klausel, wo wir die erwähnt haben Kundenname Für die Grundlage dieser Partition.

Auf diese Weise können Sie die Median -Fensterfunktion mit Amazon Redshift verwenden. Dieses Schema kann auch für komplexere und viel größere Datensätze verwendet werden.

Abschluss

Wenn Sie den Median eines Datensatzes in Amazon Redshift finden möchten, können Sie diese Aufgabe leicht mit der Rotverschiebungsmedianfunktion ausführen. In diesem Blog werden bestimmte Fälle und Szenarien der mittleren Funktion besprochen, um Ihr Verständnis klar zu machen.