Statistikmodul
Das Statistikmodul bietet einfache Funktionen für die Berechnung der Statistiken eines Datensatzes. Sie behaupten, dass sie nicht mit Numpy, Scipy oder anderen Software wie SPSS, SAS und MATLAB konkurrieren. Und in der Tat ist es ein sehr einfaches Modul. Es liefert keine parametrischen oder sogar nichtparametrischen Tests. Stattdessen kann es verwendet werden, um einige einfache Berechnungen durchzuführen (obwohl ich denke, dass selbst Excel dasselbe tun kann). Sie behaupten ferner, dass sie int, Schwimmer, Dezimalstellen und Brüche unterstützen.
Das Statistikmodul kann (1) Durchschnittswerte und Messungen der zentralen Lage, (2) Spread -Maßnahmen und (3) Statistiken für Beziehungen zwischen zwei Eingängen messen.
Statistiken.bedeuten()
Das Statistikmodul enthält eine große Anzahl von Funktionen. Wir werden nicht jeden, sondern einige von ihnen abdecken. In diesem Fall wird der Datensatz in eine Liste platziert. Die Liste wird dann an die Funktion übergeben.
Für Ganzzahlen:
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 3.5Für Brüche ist die Terminologie etwas anders. Sie müssen das Modul namens Fraktionen importieren. Außerdem müssen Sie den Bruch in Klammern stellen und ein Kapital F vor sie schreiben. Also 0.5 wäre gleich F (1,2). Dies ist für große Datensätze nicht möglich!
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 617/840In den meisten Forschungsarbeiten ist die häufigste Art der Zahl, die auftritt, der Dezimalwert, und das ist mit dem Statistikmodul viel schwieriger. Sie müssen zuerst das Dezimalmodul importieren und dann jeden Dezimalwert in das Angebot einfügen (was absurd und unpraktisch ist, wenn Sie große Datensätze haben).
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 2.813333333333333333333333333Das Statistikmodul bietet auch den Mittelwert für den FMEAN, den geometrischen Mittel und den harmonischen Mittelwert. Statistiken.Median () und Statistiken.Modus () ähneln den Statistiken.bedeuten().
Statistiken.Varianz () und Statistiken.stdev ()
In der Forschung ist sehr, sehr selten Ihre Stichprobengröße so groß, dass sie gleich oder ungefähr der Populationsgröße entspricht. Daher werden wir uns mit der Stichprobenvarianz und der Stichprobenstandardabweichung befassen. Sie bieten jedoch auch eine Bevölkerungsvarianz und eine Bevölkerungsstandardabweichung.
Wenn Sie Dezimalstellen verwenden möchten, müssen Sie das Dezimalstellenmodul noch einmal importieren. Wenn Sie Fraktionen verwenden möchten, müssen Sie das Fraktionenmodul importieren. Dies ist in Bezug auf die statistische Analyse ziemlich absurd und sehr unpraktisch.
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 7.144266666666666666666666667Alternativ kann die Standardabweichung durch Ausführen berechnet werden:
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 2.672876103875124748889421932Pearson Korrelation
Aus irgendeinem Grund ignorierte die Autoren des Statistikmodul. Wohlgemerkt, die Pearson -Korrelation ist eine bestimmte Art von Korrelation, die nur verwendet wird, wenn die Daten normal sind. Es ist daher ein parametrischer Test. Es gibt einen weiteren Test namens Spearman Correlation, der auch verwendet werden kann, wenn die Daten nicht normal sind (was tendenziell der Fall ist).
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 0.9960181677345038Lineare Regression
Wenn eine einfache lineare Regression durchgeführt wird, steckt sie eine Formel aus:
y = Steigung * x + InterceptExcel macht das auch. Das meiste, was dieses Modul tun kann, ist, den Wert der Steigung und den Abschnitt auszudrucken, aus dem Sie die Linie neu erstellen können. Excel und SPSS bieten Diagramme für die Gleichung, aber nichts davon mit dem Statistikmodul.
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.py der Hang ist 0.9111784209749394Kovarianz
Darüber hinaus kann das Statistikmodul die Kovarianz messen.
hauptsächlich.PY -ImportstatistikWenn Sie letzteres laufen, erhalten Sie:
hauptsächlich.PY 4.279719999999999Obwohl Python ein Modul namens Statistics -Modul anbietet, ist es nicht für erweiterte Statistiken! Wohlgemerkt, wenn Sie Ihren Datensatz tatsächlich analysieren möchten, dann gehen Sie mit einem anderen Modul als dem Statistikmodul ein! Es ist nicht nur zu einfach, sondern auch alle Funktionen, die es anbietet, können auch leicht in Excel gefunden werden. Darüber hinaus gibt es nur zwei Tests - die Pearson -Korrelation und die einfache lineare Regression -, die dieses Modul in Bezug auf Tests bietet. Es gibt keine ANOVA, keinen T-Test, kein Chi-Quadrat oder einen der Like! Und darüber hinaus müssen Sie das Dezimalmodul aufrufen, was für große und sehr große Datensätze frustrierend sein kann, wenn Sie Dezimalstellen verwenden müssen. Sie werden niemanden fangen, der echte statistische Arbeiten mit diesem Modul benötigt (gehen Sie mit SPSS, wenn Sie erweiterte Dinge benötigen), aber wenn es einfach Spaß macht, nach dem Sie suchen, dann ist dieses Modul genau das Richtige für Sie.
Glückliche Codierung!