Scipy Crosstab

Scipy Crosstab

Die Python -Programmiersprache bietet eine Vielzahl unglaublicher Bibliotheken, die eine lange Liste nützlicher Funktionen bieten. Mit diesen Bibliotheken und Funktionen kann jede praktische Anwendung problemlos verwaltet werden. In diesem Artikel werden wir die in der Scipy Library verfügbare CrosStab -Funktion erläutern. Die Scipy Library ist eine der am häufigsten verwendeten Bibliotheken der Python -Programmiersprache, da sie Funktionen für alle Arten von statistischen und mathematischen Operationen bietet. CrosStab ist eine weitere Funktion der Scipy Library, in der wir in diesem Handbuch diskutieren werden. Lassen Sie uns anfangen!

Was ist Crosstab?

CrosStab steht für die Cross -Tabellierung, die verwendet wird, um eine Kontingenztabelle mit zwei oder mehr Faktoren zu erstellen, indem die Frequenzen der entsprechenden Paare gezählt werden. In einfachen Worten wird eine Tabelle zurückgegeben, die die Anzahl der einzelnen Kombination der Elemente in zwei oder mehr Datensätzen enthält. Es kann verwendet werden, um eine leistungsstarke Datenanalyse durch Erstellen einer Zusammenfassungstabelle durchzuführen.

In diesem Artikel werden wir einige Beispiele demonstrieren, die Ihnen zeigen, wie Sie die CrosStab -Funktion in einem Python -Programm verwenden können. Mit diesen Beispielen können Sie die Funktion besser verstehen und sie in Ihren Programmen implementieren können. Lassen Sie uns die Syntax der Crosstab -Funktion verstehen, bevor wir uns mit dem Abschnitt der Beispiele befassen.

Was ist die Syntax der CrosStab -Funktion??

Die CrosStab -Funktion wird von der Scipy -Bibliothek im Statistikpaket und in der Notfallklasse bereitgestellt. Die Syntax der CrosStab -Funktion lautet wie folgt:


Die Parameterdatensätze* repräsentiert die Abfolge von Datensätzen, deren Cross -Tabellierung berechnet werden soll. Die Größe oder die Elemente sollten mit allen Datensätzen übereinstimmen. Die Pegel und spärlichen Parameter sind optionale Parameter. Wenn sie nicht bereitgestellt werden, wird ihr Standardwert verwendet. Das Argument der Ebenen enthält die Liste der Elemente, die in den Datensätzen gezählt werden sollen. Die Anzahl der „Ebenen“ und die Anzahl der Datensätze sollte gleich sein.

Die im Parameter der Ebene angegebenen Werte werden in den Datensätzen gezählt. Wenn keine entsprechenden Werte im Datensatz vorhanden sind, werden sie ignoriert und ihre Anzahl wird nicht im resultierenden Array zurückgegeben. Der Parameter von Ersatzteilen enthält einen wahren oder falschen Wert, der angibt, ob eine spärliche Matrix zurückgegeben werden soll oder nicht. Es ist standardmäßig falsch.

Die CrosStab -Funktion gibt zwei Elemente zurück - eines ist ein Tupel der Länge und der andere ist die Anzahl. Das „Tupel der Länge“ enthält die Reihenfolge der gezählten Elemente. Das "Count" -Element enthält die Anzahl jedes Kontingenzpaares, das auch als Kontingenztabelle bezeichnet wird. Nachdem wir nun die Syntax der CrosStab -Funktion gelernt haben, sehen wir einige Beispiele, um zu verstehen, wie die CrosStab -Funktion in einem Python -Programm implementiert werden kann.

Beispiel 1:

Beginnen wir mit einem einfachen Beispiel, damit wir kein Problem beim Verständnis der grundlegenden Arbeit der Crosstab -Funktion haben. Betrachten Sie den Beispielcode im folgenden Code -Snippet:

von Scipy.Statistiken.Eventualimport CrosStab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'Z' ]
(AVALS, XVALS), Graf = CrosStab (a, x)
print ('Array 1 enthält:', Avals)
print ('\ array 2 enthält:', xvals)
print ('\ n the crosStab ist: \ n', zählen)


Erstens wird die Scipy -Bibliothek zusammen mit dem Statistikpaket und der Notfallklasse in das Programm importiert, um die CrosStab -Funktion aufzurufen. Danach sind zwei Arrays derselben Länge bereitgestellt. Beide werden an die CrosStab -Funktion übergeben. Drei Variablen werden deklariert, wobei jeweils ein einzigartiges Ergebnis der Crosstab -Funktion enthält. Lassen Sie uns nun das Ergebnis der CrosStab -Funktion im Folgenden sehen:


Das erste Array enthält 2 einzigartige Elemente - A und B. Während das zweite Array drei einzigartige Elemente enthält - x, y und z. Die Anzahl der Kontingenz beträgt [[2, 2, 2] [2, 2, 2]], was bedeutet, dass das Paar (a, x) zweimal auftritt, das Paar (a, y) zweimal auftritt, das Paar (a, z) ) tritt zweimal auf, das Paar (b, x) tritt zweimal auf.

Beispiel 2:

Wie wir im vorherigen Beispiel erläutert haben, akzeptiert das CrosStab so viele Datensätze, wie Sie bereitstellen können. Es berechnet die Kontingenztabelle für alle Datensätze. Im vorherigen Beispiel haben wir nur 2 Datensätze bereitgestellt. Fügen wir noch einen hinzu und sehen das Ergebnis der Crosstab -Funktion. Betrachten Sie den folgenden Beispielcode:

von Scipy.Statistiken.Eventualimport CrosStab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'Z' ]
P = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, Xvals, Pvals), Graf = CrosStab (a, x, p)
print ('Array 1 enthält:', Avals)
print ('\ array 2 enthält:', xvals)
print ('\ carray 3 enthält:', pvals)
print ('\ n the crosStab ist: \ n', zählen)


Lassen Sie uns nun die folgende Ausgabe sehen, um zu verstehen, wie sich das Ergebnis des Crosstab ändert:


Da wir drei Datensätze hatten, enthält der erste Datensatz zwei eindeutige Elemente - A und B. Der zweite Datensatz enthält drei eindeutige Elemente - x, y und z. Und der dritte Datensatz enthält zwei eindeutige Elemente - 0 und 1. Wir haben die folgenden Paare (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , mit Zählungen [[[2 0] [0 2] [2 0]] [0 2] [2 0] [0 2]]], jeweils.

Beispiel 3:

Wie wir wissen, nimmt CrosStab zwei optionale Parameter ein - einer ist Ebenen und der andere spärlich spärlich. In diesem Beispiel werden wir Sie dazu leiten. Betrachten Sie das folgende Beispiel:

von Scipy.Statistiken.Eventualimport CrosStab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'Z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(AVALS, XVALS), count = CrosStab (a, x, Ebenen = (opt, opt))
print ('Array 1 enthält:', Avals)
print ('\ array 2 enthält:', xvals)
print ('\ n the crosStab ist: \ n', zählen)


Wie wir bereits erläutert haben, sollte die Anzahl der Ebenen mit der Anzahl der Datensätze übereinstimmen. Wir geben also die Ebenen = (opt, opt), um der Anzahl der Datensätze zu entsprechen. Lassen Sie uns die Kontingenztabelle in der folgenden Ausgabe sehen:

Beispiel 4:

Das zweite optionale Argument der CrosStab -Funktion ist spärlich. In diesem Beispiel werden wir den spärlichen Parameter explizit als wahr definieren, um die spärliche Matrix als Ergebnis zu erhalten. Betrachten Sie den Beispielcode im folgenden Code -Snippet:

von Scipy.Statistiken.Eventualimport CrosStab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'Z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(AVALS, XVALS), count = CrosStab (a, x, Ebenen = (opt, opt), spärlich = true)
print ('Array 1 enthält:', Avals)
print ('\ array 2 enthält:', xvals)
print ('\ n Die spärliche Matrix ist: \ n', zählen)
print ('\ n the crosStab ist: \ n', zählen.A)


Hier ist die Ausgabe der CrosStab -Funktion, die alle erforderlichen und optionalen Parameter enthält:

Abschluss

Dieser Artikel ist ein kurzer Überblick über die von der Scipy Library bereitgestellte CrosStab -Funktion. CrosStab steht für Cross -Tabelle. Es wird verwendet, um die Kontingenztabelle der angegebenen Daten zu erhalten. Es enthält eine Liste von Datensätzen, zählt die Kontingenz der im Datensatz angegebenen Elemente und gibt die Anzahl der Zählungen zurück. Mit Hilfe von Beispielen haben wir gelernt, wie man die unterschiedlichen Parameter für die Funktion bereitstellt und das gewünschte Ergebnis daraus hervorgeht.