„Das Numpy -Paket von Python bietet eine Funktion namens„ Corcoef “. Diese Funktion wird immer dann verwendet, wenn wir die Korrelationskoeffizienten für das „Pearson-Produktmoment“ berechnen müssen. Die Korrelationskoeffizienten, die wir für die Pearson-Produktmoment über das Ausmaß der Korrelation zwischen den beiden Variablen berechnet haben. Diese Korrelationskoeffizienten werden häufig berechnet, wenn die beiden Diagramme auf dem verstreuten Diagramm aufgetragen werden, und wir erwarten, dass die Beziehung zwischen diesen Variablen eher zur linearen Beziehung geneigt ist. Daher schätzen wir die lineare Zugehörigkeit zwischen den Variablen und der Verwendung des Korrelationskoeffizienten anhand der Korrelationskoeffizienten. Diese Korrelationskoeffizienten werden als „R“ dargestellt.
Der Numpy ist bekannt als die bekannteste Bibliothek aus Python, und alle Operationen (mathematisch und algebraisch) können auf den ND-Arrays mit den Funktionen, die dieses Bibliothekspaket bietet, angewendet werden.”
Verfahren
In diesem Artikel wird die Methode zur Schätzung der Korrelation zwischen den beiden Variablen unter Verwendung der Funktion numpy corcoef () angezeigt. Wir lernen die Methode, um das Programm in das Python -Skript für diese Funktion zu schreiben, indem wir das Programm auf dem Python -Compiler für verschiedene Beispiele praktisch ausführen.
Syntax
Die Funktionen nehmen die Variablen oder die Arrays auf, und die Korrelationen zwischen diesen Arrays werden dann von der Funktion berechnet und werden als Funktionsausgabe zurückgegeben.
Numpy. Corcoef (x, y = none, rowvar = true, bias =, ddof =, dtype)
Das „X“ und „Y“ sind die Arrays, die wir angeben müssen, um die Korrelationskoeffizienten der Variablen zu berechnen. "Zeilen var" ist ein optionaler Parameter. Wenn sein Wert auf true festgelegt ist, was auch sein Standardwert ist, ist die Funktion der Ansicht, dass jede Zeile für den Fall von Falsch eine Variable ist, die jede Spalte eine Variable darstellt. "DTYPE" ist der Datentyp, der standardmäßig der "Float" für die Ausgabe ist, und die restlichen zwei Parameter "Vorspannung" und "DDOF" sind entweder optional oder werden nicht berücksichtigt, sodass wir sie nicht die Mühe machen, sie zu verwenden.
Rückgabewert
Der Rückgabewert für die Methode Numpy Corcoef () sind die Korrelationskoeffizienten, die die Korrelation zwischen den Variablen aufzeigen.
Beispiel # 01
Wenn wir an Statistiken und Datenwissenschaften arbeiten, erfahren wir, dass diese beiden Felder mehr mit der Kenntnis der Beziehung zwischen den Variablen im Datensatz sind. Jeder Datenpunkt in einem Datensatz ist die Beobachtung, und die Eigenschaften jeder Beobachtung werden als Merkmal dargestellt, und diese Merkmale sind die Variablen des Datensatzes. Und welcher Datensatz wir verwenden, befasst sich mit der Funktion oder den Variablen und Beobachtungen.
Um die Korrelation zwischen den Merkmalen zu verstehen, denken Sie an ein Beispiel dafür, wie die Genauigkeit beim Schießen des Basketballs auf das Ziel des Spielers von der Höhe des Spielers beeinflusst wird. ". Wir haben jetzt gelernt, was genau das Feature ist und wie viel es wichtig ist, über ihre Korrelation zu wissen. Lassen Sie uns damit diese Corcoef () -Funktion untersuchen, indem wir sie in den ND-Arrays implementieren, um die Korrelation zwischen den Merkmalen der Arrays zu finden. Die Software, die wir verwenden werden, um das Beispiel zu implementieren.
Wir werden mit dem Schreiben des Programms beginnen und das Numpy -Modul aus der Numpy -Bibliothek importieren. Dies ist obligatorisch, um mit den ND-Arrays zu arbeiten. Wir werden zum nächsten Schritt voranschreiten und zwei Arrays (eindimensional) erstellen, indem wir das „NP“ aufrufen. Array () ”Methode und nennt die Arrays„ arr_1 “bzw.„ arr_2 “. Wir können die Arrays mit zufälligen Elementen initialisieren. Zum Beispiel werden wir sie für arr_1 und "[4, 7, 8]" für arr_2 als "[3, 6, 9]" angeben. Jetzt wollen wir die Korrelation zwischen diesen beiden Arrays wissen. Corcoef (arr_1, arr_2) ”und dann die Ergebnisse dieser Funktion anzeigen. Der Code für dieses Beispiel wird in der Programmiersprache „Python“ wie folgt umgeschrieben:
Die Funktion gab ein 2D-Array der Korrelationskoeffizienten mit dem Standarddatentyp "Float" zurück. Mit diesen Korrelationskoeffizienten können wir nun die Linearität in der Beziehung zwischen zwei oder sogar mehr als zwei Variablen schätzen. Wenn wir das 2D-Matrix beobachten, sind die oberen diagonalen Werte „1“, dies liegt daran Korrelation zwischen arr_1 und arr_2 und sie sind gleich und haben den Wert “0.96 ”, und dies repräsentiert die Pearson-Produktmoment-Korrelationskoeffizienten.
Beispiel # 02
Dieses Beispiel nimmt den Corcoef () für die zweidimensionalen Arrays ein, und wir werden diese beiden Arrays mit der Methode „NP definieren. Array () ”. Die Elemente für diese beiden Arrays sind "([3, 6, 9], [4, 7, 8])" und "([6, 3, 8], [2, 5, 12])". Wir werden diese beiden 2D-Arrays "arr_1" und "arr_2" benennen und dann diese Arrays an die Methode Numpy Corcoef () übergeben und die Ergebnisse aus dieser Funktion speichern und sie mithilfe der Methode Print () angezeigt. Der Code für dieses Beispiel ist in der unten beigefügten Abbildung dargestellt. Wir werden diesen Code kopieren und ihn auf dem Compiler „Spyder“ ausgeführt werden.
Der Ausgang hat das vierdimensionale Array mit den Korrelationskoeffizienten als Elemente mit dem Datentyp Float angezeigt. Diese Koeffizienten repräsentieren die Beziehung zwischen den zweidimensionalen Arrays, die wir im Beispiel deklariert hatten. Beachten Sie aus dem Artikel, dass die obere Diagonale den gleichen Wert von 1 hat, was zeigt, dass sie die Korrelationskoeffizienten für die gleichen Variablen sind, und die Werte an anderen Stellen variieren; Dies liegt daran, dass diese Werte die Korrelation zwischen den verschiedenen Variablen zeigen.
Abschluss
Diese Anleitung deckt die Korrelationskoeffizientenfunktion für die „Pearson-Produktmoment“ ab. Wir haben in dem Artikel gezeigt, wie wir diese Funktion auf die eindimensionalen und mehrdimensionalen Arrays anwenden können, und in welcher Form die Funktion die Ausgabe für die ND-Arrays zurückgibt. Wir haben die Ausgänge aus der Funktion für die beiden verschiedenen Beispiele weiter analysiert.