Anaconda Python Tutorial

Anaconda Python Tutorial

Anaconda ist eine Datenwissenschafts- und maschinelle Lernplattform für die Python- und R -Programmiersprachen. Es ist so konzipiert, dass es das Erstellen und Verteilungsprozess einfach, stabil und reproduzierbar über Systeme erstellt und verteilt wird, und ist unter Linux, Windows und OSX verfügbar. Anaconda ist eine Python-basierte Plattform, die wichtige Datenwissenschaftspakete wie Pandas, Scikit-Learn, Scipy, Numpy und Googles maschinelles Lernen, TensorFlow, kuratiert. Es wird mit Conda (einem PIP -ähnlichen Install -Tool), Anaconda Navigator für eine GUI -Erfahrung und Spyder für eine IDE verpackt.Dieses Tutorial wird durch einige der Grundlagen von Anaconda, Conda und Spyder für die Python -Programmiersprache gehen und Sie mit den Konzepten vorstellen, die erforderlich sind, um Ihre eigenen Projekte zu erstellen.

Installation

Auf dieser Website gibt es viele großartige Artikel zur Installation von Anaconda auf verschiedenen Distribos- und nativen Paketmanagementsystemen. Aus diesem Grund werde ich unten einige Links zu dieser Arbeit liefern und zum Abdecken des Werkzeugs selbst überspringen.

  • Centos
  • Ubuntu

Grundlagen von Conda

Conda ist das Anaconda -Paketmanagement- und Umgebungswerkzeug, das der Kern von Anaconda ist. Es ist ähnlich wie PIP mit der Ausnahme, dass es für die Arbeit mit Python, C und R -Paketmanagement entwickelt wurde. Conda verwaltet auch virtuelle Umgebungen auf ähnliche Weise wie Virtualenv, über die ich hier geschrieben habe.

Installation bestätigen

Der erste Schritt besteht darin, die Installation und Version in Ihrem System zu bestätigen. Die folgenden Befehle prüfen, ob Anaconda installiert ist, und drucken die Version in das Terminal.

$ conda -Verssion

Sie sollten ähnliche Ergebnisse wie die unten sehen. Ich habe derzeit Version 4.4.7 installiert.

$ conda -Verssion
Conda 4.4.7

Update-Version

Conda kann mithilfe von Condas Update -Argument wie unten aktualisiert werden.

$ conda Update Conda

Dieser Befehl wird auf Conda auf die aktuellste Version aktualisiert.

Fahren Sie fort ([y]/n)? y
Pakete herunterladen und extrahieren
Conda 4.4.8: ######################################################################################################################## zuraut, ########### | 100%
OpenSSL 1.0.2N: ############################################################################################################## zu erhalten ######## | 100%
Certifi 2018.1.18: ############################################################################################################################### zuraut, ##### | 100%
CA-Zertifikate 2017.08.26: ############################################### | 100%
Transaktion vorbereiten: fertig
Überprüfung der Transaktion: Fertig
Transaktion ausführen: Fertig

Wenn wir das Versionsargument erneut ausführen, sehen wir, dass meine Version auf 4 aktualisiert wurde.4.8, das ist die neueste Veröffentlichung des Tools.

$ conda -Verssion
Conda 4.4.8

Eine neue Umgebung schaffen

Um eine neue virtuelle Umgebung zu erstellen, führen Sie die folgende Reihe von Befehlen aus.

$ conda create -n tutorialconda python = 3 $ fordere (y]/n)? y

Sie können die Pakete sehen, die unten in Ihre neue Umgebung installiert sind.

Pakete herunterladen und extrahieren
Certifi 2018.1.18: ############################################################################################################################### zuraut, ##### | 100%
Sqlite 3.22.0: ################################################################################### zu erhalten ######### | 100%
Rad 0.30.0: ################################################################################### zu erhalten ########## | 100%
Tk 8.6.7: ################################################################################################################### zu erhalten ############## | 100%
Readline 7.0: ################################################################################### zu erhalten ########## | 100%
Ncurses 6.0: ################################################################################### zu erhalten ########### | 100%
libcxxabi 4.0.1: ############################################################################################################################# zu erhalten ####### | 100%
Python 3.6.4: ######################################################################################################################## zuraut, ########## | 100%
libffi 3.2.1: ############################################################################################################################# zu erhalten ########## | 100%
setuptools 38.4.0: ################################################################################### zu erhalten ##### | 100%
libedit 3.1: ############################################################################################################################# zu erhalten ########### | 100%
XZ 5.2.3: ################################################ ############## | 100%
Zlib 1.2.11: ################################################################################################################## zu erhalten ########### | 100%
PIP 9.0.1: ############################################################################################################################# zu erhalten ############# | 100%
libcxx 4.0.1: ############################################################################################################################# zu erhalten ########## | 100%
Transaktion vorbereiten: fertig
Überprüfung der Transaktion: Fertig
Transaktion ausführen: Fertig
#
# Um diese Umgebung zu aktivieren, verwenden Sie:
#> Quelle aktivieren Tutorialconda
#
# Um eine aktive Umgebung zu deaktivieren, verwenden Sie:
#> Source deaktivieren
#

Aktivierung

Ähnlich wie Virtualenv müssen Sie Ihre neu erstellte Umgebung aktivieren. Der folgende Befehl aktiviert Ihre Umgebung unter Linux.

Source Activate Tutorialconda Bradleys-Mini: ~ Bradleypatton $ Quelle Aktivierung Tutorialconda
(Tutorialconda) Bradleys-Mini: ~ Bradleypatton $

Pakete installieren

In dem Befehl conda list werden die derzeit in Ihrem Projekt installierten Pakete aufgelistet. Mit dem Befehl Install können Sie zusätzliche Pakete und ihre Abhängigkeiten hinzufügen.

$ Conda List # Pakete in Umgebung bei/Benutzer/Bradleypatton/Anaconda/Envs/Tutorialconda:
#
# NAME VERSIONS -BUST -Kanal
CA-Zertifikate 2017.08.26 HA1E5D58_0
Certifi 2018.1.18 PY36_0
libcxx 4.0.1 H579ED51_0
libcxxabi 4.0.1 Hebd6815_0
libedit 3.1 HB4E282D_0
libffi 3.2.1 H475C297_4
Ncurses 6.0 HD04F020_2
OpenSSL 1.0.2N HDBC3D79_0
PIP 9.0.1 PY36H1555ced_4
Python 3.6.4 HC167B69_1
Readline 7.0 HC1231FA_4
setuptools 38.4.0 py36_0
Sqlite 3.22.0 H3EFE00B_0
Tk 8.6.7 H35A86E2_3
Rad 0.30.0 PY36H5EB2C71_1
XZ 5.2.3 H0278029_2
Zlib 1.2.11 HF3CBC9B_2

Um Pandas in die aktuelle Umgebung zu installieren, werden Sie den folgenden Shell -Befehl ausführen.

$ conda installieren pandas

Es wird die entsprechenden Pakete und Abhängigkeiten heruntergeladen und installiert.

Die folgenden Pakete werden heruntergeladen:
Paket | bauen
---------------------------|-----------------
libgFortran-3.0.1 | H93005F0_2 495 KB
Pandas-0.22.0 | PY36H0A44026_0 10.0 MB
Numpy-1.14.0 | PY36H8A80B8C_1 3.9 MB
Python-datutil-2.6.1 | PY36H86D2ABB_1 238 KB
MKL-2018.0.1 | HFBD8650_4 155.1 MB
Pytz-2017.3 | PY36HF0BF824_0 210 KB
Sechs-1.11.0 | PY36H0E22D5E_1 21 KB
Intel-OpenMP-2018.0.0 | H8158457_8 493 KB
------------------------------------------------------------
Gesamt: 170.3 MB
Die folgenden neuen Pakete werden installiert:
Intel-OpenMP: 2018.0.0-H8158457_8
libgFortran: 3.0.1-H93005F0_2
MKL: 2018.0.1-HFBD8650_4
Numpy: 1.14.0-PY36H8A80B8C_1
Pandas: 0.22.0-PY36H0A44026_0
Python-datutil: 2.6.1-PY36H86D2ABB_1
Pytz: 2017.3-PY36HF0BF824_0
Sechs: 1.11.0-Py36H0E22D5E_1

Durch erneutes Ausführen des Listenbefehls sehen wir die neuen Pakete in unserer virtuellen Umgebung installiert.

$ conda liste
# Pakete in der Umgebung bei/Benutzern/Bradleypatton/Anaconda/Envs/Tutorialconda:
#
# NAME VERSIONS -BUST -Kanal
CA-Zertifikate 2017.08.26 HA1E5D58_0
Certifi 2018.1.18 PY36_0
Intel-OpenMP 2018.0.0 H8158457_8
libcxx 4.0.1 H579ED51_0
libcxxabi 4.0.1 Hebd6815_0
libedit 3.1 HB4E282D_0
libffi 3.2.1 H475C297_4
libgFortran 3.0.1 H93005F0_2
MKL 2018.0.1 HFBD8650_4
Ncurses 6.0 HD04F020_2
Numpy 1.14.0 PY36H8A80B8C_1
OpenSSL 1.0.2N HDBC3D79_0
Pandas 0.22.0 PY36H0A44026_0
PIP 9.0.1 PY36H1555ced_4
Python 3.6.4 HC167B69_1
Python-datutil 2.6.1 PY36H86D2ABB_1
Pytz 2017.3 PY36HF0BF824_0
Readline 7.0 HC1231FA_4
setuptools 38.4.0 py36_0
sechs 1.11.0 PY36H0E22D5E_1
Sqlite 3.22.0 H3EFE00B_0
Tk 8.6.7 H35A86E2_3
Rad 0.30.0 PY36H5EB2C71_1
XZ 5.2.3 H0278029_2
Zlib 1.2.11 HF3CBC9B_2

Für Pakete, die nicht Teil des Anaconda -Repositorys sind, können Sie die typischen PIP -Befehle verwenden. Ich werde das hier nicht behandeln, da die meisten Python -Benutzer mit den Befehlen vertraut sein werden.

Anaconda Navigator

Anaconda umfasst eine GUI -basierte Navigator -Anwendung, die das Leben für die Entwicklung erleichtert. Es enthält das Spyder IDE- und Jupyter -Notizbuch als vorinstallierte Projekte. Auf diese Weise können Sie ein Projekt aus Ihrer GUI -Desktop -Umgebung schnell abbauen.

Um aus unserer neu erstellten Umgebung vom Navigator zu arbeiten, müssen wir unsere Umgebung unter der Werkzeugleiste links auswählen.

Wir müssen dann die Tools installieren, die wir gerne verwenden würden. Für mich ist das nämlich Spyder IDE. Hier mache ich den größten Teil meiner Datenwissenschaftsarbeit und für mich ist dies eine effiziente und produktive Python -IDE. Sie klicken einfach auf die Schaltfläche Installation auf der Dock -Fliese für Spyder. Navigator erledigt den Rest.

Nach der Installation können Sie die IDE aus derselben Dockfliese öffnen. Dies startet Spyder aus Ihrer Desktop -Umgebung.

Spyder

Spyder ist die Standard -IDE für Anaconda und sowohl für Standard- als auch für Datenwissenschaftsprojekte in Python leistungsfähig. Die Spyder IDE verfügt.

Spyder enthält auch Standard -Debugging -Funktionen und einen variablen Explorer, der unterstützt, wenn etwas nicht genau wie geplant verläuft.

Als Illustration habe ich eine kleine Sklearn -Anwendung aufgenommen, die eine zufällige Forrest -Regression verwendet, um zukünftige Aktienkurse vorherzusagen. Ich habe auch einige der Ipython -Notebook -Ausgabe aufgenommen, um die Nützlichkeit des Tools zu demonstrieren.

Ich habe einige andere Tutorials, die ich unten geschrieben habe, wenn Sie weiterhin Datenwissenschaft erkundet möchten. Die meisten davon werden mit Hilfe von Anaconda geschrieben und Spyder ABnd sollten nahtlos in der Umwelt arbeiten.

  • Pandas-Daten-Frame-Tutorial
  • Psycopg2-Tutorial
  • Kwant
Pandas als PD importieren
aus pandas_datareader importieren Daten
Numph als NP importieren
Talib als ta importieren
von Sklearn.CROSS_VALIDATION IMPAIL Train_test_split
von Sklearn.linear_model import linearregression
von Sklearn.Metriken importieren Mean_Squared_error
von Sklearn.Ensemble importieren RandomforestRegressor
von Sklearn.Metriken importieren Mean_Squared_error
Def get_data (Symbole, start_date, End_date, Symbol):
Panel = Daten.DataReader (Symbole, 'Yahoo', start_date, end_date)
df = panel ['close']
drucken (df.Kopf (5))
drucken (df.Schwanz (5))
drucken df.loc ["2017-12-12"]
drucken df.loc ["2017-12-12", Symbol]
drucken df.loc [:, Symbol]
df.fillna (1.0)
df ["rsi"] = ta.RSI (NP.Array (df.Iloc [:, 0]))
df ["SMA"] = ta.SMA (NP.Array (df.Iloc [:, 0]))
df ["bbandsu"] = ta.Bbands (NP.Array (df.Iloc [:, 0]) [0]
df ["bbandsl"] = ta.Bbands (NP.Array (df.Iloc [:, 0]) [1]
df ["rsi"] = df ["rsi"].Verschiebung (-2)
DF ["SMA"] = DF ["SMA"].Verschiebung (-2)
df ["bbandsu"] = df ["bbandsu"].Verschiebung (-2)
df ["bbandsl"] = df ["bbandsl"].Verschiebung (-2)
df = df.fillna (0)
drucken df
Zug = df.Probe (FRAC = 0.8, random_state = 1)
test = df.loc [~ df.Index.ISIN (Zug.Index)]
Druck (Zug.Form)
Druck (Test.Form)
# Holen Sie sich alle Spalten aus dem DataFrame.
Spalten = df.Säulen.auflisten()
Druckenspalten
# Speichern Sie die Variable, auf die wir uns vorhersagen werden.
Ziel = Symbol
# Initialisieren Sie die Modellklasse.
model = randomforestregressor (n_estimators = 100, min_samples_leaf = 10, random_state = 1)
# Das Modell in die Trainingsdaten einfügen.
Modell.fit (Zug [Spalten], Zug [Ziel])
# Generieren Sie unsere Vorhersagen für den Testsatz.
Vorhersagen = Modell.vorhersagen (Test [Spalten])
Drucken Sie "Pred" drucken "
Druckvorhersagen
#df2 = pd.DataFrame (Data = Vorhersagen [:])
#print df2
#df = pd.concat ([test, df2], axis = 1)
# Fehler zwischen unseren Testvorhersagen und den tatsächlichen Werten berechnen.
Druck "Mean_Squared_error:" + str (Mean_Squared_error (Vorhersagen, Test [Ziel]))
Return df
Def Normalize_Data (DF):
Rückgabe df / df.Iloc [0 ,:]
Def Plot_data (df,):
ax = df.Plot (Titel = Titel, fontsize = 2)
Axt.set_xlabel ("Datum")
Axt.set_ylabel ("Preis")
Parzelle.zeigen()
def tutorial_run ():
#Choose Symbole
symbol = "egrx"
Symbole = [Symbol]
#Daten bekommen
df = get_data (Symbole, '2005-01-03', '2017-12-31', Symbol)
Normalize_data (DF)
plot_data (df)
Wenn __name__ == "__main__":
Tutorial_run () Name: EGRX, Länge: 979, DTYPE: Float64
EGRX RSI SMA Bbandsu Bbandsl
Datum
2017-12-29 53.419998 0.000000 0.000000 0.000000 0.000000
2017-12-28 54.740002 0.000000 0.000000 0.000000 0.000000
2017-12-27 54.160000 0.000000 0.000000 55.271265 54.289999
Abschluss

Anaconda ist eine großartige Umgebung für Datenwissenschaft und maschinelles Lernen in Python. Es verfügt über ein Repo von kuratierten Paketen, die für eine leistungsstabile, stabile und reproduzierbare Datenwissenschaftsplattform zusammenarbeiten sollen. Dies ermöglicht einem Entwickler, seinen Inhalt zu verteilen und sicherzustellen. Es wird mit integrierten Tools geliefert, um das Leben zu erleichtern, wie der Navigator, sodass Sie problemlos Projekte erstellen und Umgebungen wechseln können. Es ist meine Anlaufstelle für die Entwicklung von Algorithmen und die Erstellung von Projekten zur Finanzanalyse. Ich finde sogar, dass ich die meisten meiner Python -Projekte verwende, weil ich mit der Umwelt vertraut bin. Wenn Sie in Python und Data Science beginnen möchten, ist Anaconda eine gute Wahl.